- Błąd średniej kwadratowej
- rezydualna suma kwadratów
- błąd resztkowy standardowy
- średni błąd kwadratu
- błąd testu
Myślałem, że kiedyś rozumiałem te terminy, ale im więcej robię problemów statystycznych, tym bardziej się mylę, gdy się domyślam. Chciałbym trochę pewności i konkretnego przykładu
Potrafię łatwo znaleźć równania w Internecie, ale mam problem z uzyskaniem wyjaśnienia tych terminów „wyjaśnij, że jestem 5”, aby móc skrystalizować w głowie różnice i sposób, w jaki jedno prowadzi do drugiego.
Jeśli ktoś może wziąć ten kod poniżej i wskazać, jak obliczyć każdy z tych warunków, byłbym wdzięczny. Kod R byłby świetny ..
Korzystając z tego przykładu poniżej:
summary(lm(mpg~hp, data=mtcars))
Pokaż mi w kodzie R, jak znaleźć:
rmse = ____
rss = ____
residual_standard_error = ______ # i know its there but need understanding
mean_squared_error = _______
test_error = ________
Punkty bonusowe za wyjaśnienie, jak jestem 5, różnic / podobieństw między nimi. przykład:
rmse = squareroot(mss)
r
regression
residuals
użytkownik3788557
źródło
źródło
Odpowiedzi:
Zgodnie z życzeniem, ilustruję za pomocą prostej regresji przy użyciu
mtcars
danych:Średni błąd squared (MSE) jest średnią kwadratu reszt:
Błąd średniej kwadratowej (RMSE) jest wówczas pierwiastkiem kwadratowym z MSE:
Resztkowa suma kwadratów (RSS) to suma kwadratów reszt:
Błąd resztkowy standardowy (RSE) to pierwiastek kwadratowy z (RSS / stopni swobody):
To samo obliczenie, uproszczone, ponieważ wcześniej obliczyliśmy
rss
:Termin błąd testu w kontekście regresji (i innych technik analizy predykcyjnej) zwykle odnosi się do obliczania statystyki testu na danych testowych, niezależnie od danych treningowych.
Innymi słowy, model szacuje się na podstawie części danych (często próba 80%), a następnie oblicza się błąd na podstawie próby wstrzymania. Ponownie ilustruję użycie
mtcars
, tym razem z próbką 80%Oszacuj model, a następnie przewiduj na podstawie danych wstrzymania:
Połącz oryginalne dane i prognozy w ramce danych
Teraz oblicz swoje statystyki testowe w normalny sposób. Ilustruję MSE i RMSE:
Zauważ, że ta odpowiedź ignoruje ważność obserwacji.
źródło
Oryginalny plakat poprosił o odpowiedź „wytłumacz jak jestem 5”. Powiedzmy, że nauczyciel w szkole zaprasza ciebie i twoich kolegów, aby odgadli szerokość stołu nauczyciela. Każdy z 20 uczniów w klasie może wybrać urządzenie (linijkę, skalę, taśmę lub miernik) i może zmierzyć stół 10 razy. Wszyscy są proszeni o użycie różnych lokalizacji początkowych w urządzeniu, aby uniknąć ciągłego odczytywania tego samego numeru; odczyt początkowy należy następnie odjąć od odczytu końcowego, aby w końcu uzyskać jeden pomiar szerokości (ostatnio nauczyłeś się, jak wykonywać tego rodzaju matematykę).
Klasa wykonała w sumie 200 pomiarów szerokości (20 uczniów, po 10 pomiarów każdy). Obserwacje są przekazywane nauczycielowi, który skruszy liczby. Odjęcie obserwacji każdego ucznia od wartości odniesienia spowoduje kolejne 200 liczb, zwanych odchyleniami . Nauczyciel uśrednia próbkę każdego ucznia osobno, uzyskując 20 środków . Odjęcie obserwacji każdego ucznia od jego indywidualnej średniej spowoduje 200 odchyleń od średniej, zwanych resztami . Gdyby obliczono średnią resztkową dla każdej próbki, można zauważyć, że zawsze wynosi zero. Jeśli zamiast tego wyprostujemy każdą resztę, uśrednimy ją i ostatecznie cofniemy kwadrat, otrzymamy odchylenie standardowe. (Nawiasem mówiąc, nazywamy to ostatnie obliczenie bitem pierwiastka kwadratowego (pomyślmy o znalezieniu podstawy lub boku danego kwadratu), więc cała operacja jest w skrócie często nazywana pierwiastkiem średnim kwadratem , w skrócie; standardowe odchylenie obserwacji wynosi średnia kwadratowa reszt.)
Ale nauczyciel znał już prawdziwą szerokość stołu, na podstawie tego, jak został zaprojektowany, zbudowany i sprawdzony w fabryce. Zatem kolejne 200 liczb, zwanych błędami , można obliczyć jako odchylenie obserwacji w stosunku do prawdziwej szerokości. Średni błąd można obliczyć dla każdej próbki studentów. Podobnie, 20 odchyleń standardowych błędu lub błędu standardowego , można obliczyć dla obserwacji. Więcej 20 błąd średniej kwadratowejwartości można również obliczyć. Trzy zestawy 20 wartości są powiązane jako sqrt (me ^ 2 + se ^ 2) = rmse, w kolejności pojawiania się. Opierając się na rmse, nauczyciel może ocenić, czyj uczeń podał najlepszą ocenę szerokości stołu. Ponadto, patrząc oddzielnie na 20 średnich błędów i 20 standardowych wartości błędów, nauczyciel może pouczyć każdego ucznia, jak poprawić swoje odczyty.
W ramach kontroli nauczyciel odejmował każdy błąd od odpowiadającego mu średniego błędu, co skutkowało kolejnymi 200 liczbami, które nazywamy błędami resztkowymi (co nie jest często wykonywane). Jak wyżej, średni błąd resztkowy wynosi zero, więc odchylenie standardowe błędów resztkowych lub standardowy błąd resztkowy jest taki sam, jak błąd standardowy , i tak samo jest również z błędem resztkowym średniej kwadratowej . (Szczegóły poniżej.)
Teraz jest coś interesującego dla nauczyciela. Możemy porównać średnią każdego ucznia z resztą klasy (20 oznacza w sumie). Tak jak zdefiniowaliśmy przed tymi wartościami punktowymi:
możemy również zdefiniować teraz:
Tylko jeśli mówi się, że klasa uczniów jest bezstronna, tj. Jeśli mem = 0, to sem = sm = rmsem; tj. błąd standardowy średniej, odchylenie standardowe średniej i błąd pierwiastkowy średniej kwadratowej średnia może być taka sama, pod warunkiem, że średni błąd średniej wynosi zero.
Gdybyśmy pobrali tylko jedną próbkę, tj. Gdyby w klasie był tylko jeden uczeń, odchylenie standardowe obserwacji (s) można by zastosować do oszacowania odchylenia standardowego średniej (sm), jako sm ^ 2 ~ s ^ 2 / n, gdzie n = 10 to wielkość próby (liczba odczytów na ucznia). Oba będą się lepiej zgadzać w miarę wzrostu wielkości próby (n = 10,11, ...; więcej odczytów na ucznia) i liczby próbek rośnie (n '= 20,21, ...; więcej uczniów w klasie). (Zastrzeżenie: niekwalifikowany „błąd standardowy” częściej odnosi się do standardowego błędu średniej, a nie do standardowego błędu obserwacji.)
Oto kilka szczegółów związanych z obliczeniami. Prawdziwa wartość jest oznaczona t.
Operacje od punktu do punktu:
ZESTAWY PRÓBEK:
PUNKTY WEWNĘTRZNE (patrz tabela 1):
ZESTAWY MIĘDZYPróbKOWE (ZESTAWOWE):
PUNKTY MIĘDZY PRÓBKAMI (ZATRUDNIANE) (patrz tabela 2):
źródło
Uważam również, że wszystkie warunki są bardzo mylące. Uważam, że konieczne jest wyjaśnienie, dlaczego mamy tak wiele wskaźników.
Oto moja uwaga na temat SSE i RMSE:
Pierwsza metryka: Suma kwadratów błędów (SSE). Inne nazwy, Resztkowa suma kwadratów (RSS), Suma kwadratów resztkowych (SSR).
Jeśli jesteśmy w społeczności optymalizacyjnej, SSE jest szeroko stosowane. Jest tak, ponieważ jest to cel optymalizacji, gdzie jest optymalizacja
Druga metryka: błąd średniej kwadratowej (RMSE) . Inne nazwy, odchylenie średnich kwadratowych.
RMSE to
źródło