Czy RMSE i MAE mogą mieć tę samą wartość?

9

Wdrażam weryfikację krzyżową i obliczanie wskaźników błędów, takich jak RMSE, , MAE, MSE itp.R2

Czy RMSE i MAE mogą mieć tę samą wartość?

Perl
źródło
1
Tak. Dlaczego nie? Niech będzie zawsze a predyktorem dla będzie zawsze . ProszęX0X1
David

Odpowiedzi:

17

Tak, teoretycznie. Najprostszym przypadkiem, jaki mogę sobie wyobrazić, jest zestaw danych, w którym wszystkie błędy predykcji (tj. Wartości resztowe) wynoszą dokładnie 1. RMSE i MAE zwrócą identyczne wartości 1. Można również skonstruować inne scenariusze, ale żaden nie wydaje się bardzo prawdopodobny.±

EDYCJA: Dzięki @DilipSarwate za wskazanie (dalej rozwinięte przez @ user20160 w ich doskonałej odpowiedzi), że ten wynik jest możliwy wtedy i tylko wtedy, gdy bezwzględne wartości wszystkich błędów prognoz są identyczne. Innymi słowy, nie ma nic specjalnego w wartości 1; każda inna liczba działałaby zamiast 1.±

mkt - Przywróć Monikę
źródło
1
Czy możesz podać przykład innych scenariuszy, które planujesz? Mam na myśli przykład inny niż wielokrotność skalarna (gdy wszystkie reszty to zamiast ) z powyższego przykładu. ±σ±1
Dilip Sarwate
@DilipSarwate Zastanawiałem się nad tym, kiedy user20160 dodał znacznie lepszą odpowiedź, która obejmuje ją bardziej szczegółowo niż mogłem.
mkt - Przywróć Monikę
1
@mkt Dzięki za miłe słowa. Twoja odpowiedź jest poprawna i zwięzła (+1)
20160
@DilipSarwate Dzięki za dane wejściowe
mkt - Przywróć Monikę
1
Kilka dodatkowych ozdób do twojej odpowiedzi: (i) musi być parzyste (powiedzmy ) i (ii) dokładnie reszty muszą mieć wartość i dokładnie reszty musi mieć wartość , co oczywiście oznacza że wszystkie reszty mają wartość bezwzględną jak twierdzisz, ale (ii) zapewnia, że ​​reszty sumują się do jak muszą. Resztki są odchyleniami od średniej i dlatego muszą sumować się do zera. nn=2)kk+σk-σσ0
Dilip Sarwate
23

Średni błąd bezwzględny (MAE) może być równy średniemu kwadratowemu błędowi (MSE) lub pierwszoplanowemu średniemu kwadratowemu błędowi (RMSE) w określonych warunkach, które pokażę poniżej. Warunki te są mało prawdopodobne w praktyce.

Czynności wstępne

Niechoznacza wartość bezwzględną reszty dla tego punktu danych i niech będzie wektorem zawierającym bezwzględne reszty dla wszystkich punktów w zbiorze danych. Niech oznacza wektor , MAE, MSE i RMSE można zapisać jako:rja=|yja-y^ja|jar=[rja,,rn]T.n1n×1

(1)M.ZAmi=1n1T.rM.S.mi=1nrT.rRM.S.mi=1nrT.r

MSE

Ustawienie MSE równego MAE i przegrupowanie daje:

(2)(r-1)T.r=0

MSE i MAE są równe dla wszystkich zestawów danych, w których wartości bezwzględne rozwiązują powyższe równanie. Dwa oczywiste rozwiązania to: (błąd zerowy) i (reszty to wszystkie , jak wspomniano mkt). Ale istnieje nieskończenie wiele rozwiązań.r=0r=1±1

Można interpretować równania geometrycznie następująco: LHS kropka produkt i . Produkt o zerowej kropce oznacza ortogonalność. Zatem MSE i MAE są równe, jeśli odjęcie 1 od każdej absolutnej reszty daje wektor, który jest ortogonalny do oryginalnych absolutnych reszt.(2))r-1r

Ponadto, wypełniając kwadrat, równanie można przepisać jako:(2))

(3)(r-12)1)T.(r-12)1)=n4

To równanie opisuje wymiarową kulę wyśrodkowaną na o promieniu . MSE i MAE są równe wtedy i tylko wtedy, gdy absolutne reszty leżą na powierzchni tej hipersfery.n[12),,12)]T.12)n

RMSE

Ustawienie wartości RMSE równej MAE i zmiana kolejności daje:

(4)rT.ZAr=0

ZA=(nja-11T.)

gdzie matrycą tożsamości. Zestaw rozwiązaniem jest miejsce zerowa od ; to znaczy zbiór wszystkich taki, że . Aby znaleźć przestrzeń zerową, zwróć uwagę, że jest macierzą z elementami ukośnymi równymi i wszystkimi innymi elementami równymi . Instrukcja odpowiada układowi równań:jaZArZAr=0ZAn×nn-1-1ZAr=0

(5)(n-1)rja-jotjarjot=0ja

Lub przestawianie rzeczy:

(6)rja=1n-1jotjarjotja

Oznacza to, że każdy element musi być równy średniej pozostałych elementów. Jedynym sposobem spełnienia tego wymogu jest wyrównanie wszystkich pierwiastków (ten wynik można również uzyskać, biorąc pod uwagę składową składową ). Dlatego zestaw rozwiązań składa się ze wszystkich nieujemnych wektorów z identycznymi wpisami:rjaZA

{rr=c1c0}

Tak więc RMSE i MAE są równe wtedy i tylko wtedy, gdy bezwzględne wartości reszt są równe dla wszystkich punktów danych.

user20160
źródło
1
+1. Czułem potrzebę sprawdzenia, czy większość tej hipersfery leży w regionie, w którym wszystkie składniki są nieujemne, co jest wymogiem absolutnych reszt: to przekonało mnie, że naprawdę istnieje wiele (nietrywialnych) rozwiązań. r
whuber
1
W rzeczywistości chodziło o to, czy RMSE i MAE mogą być równe, a nie, czy MSE i MAE mogą być równe. Być może odpowiedź @ mkt (lub jej ogólna wersja, którą zasugerowałem w komentarzu) jest jedyną odpowiedzią na pytanie RMSE = MAE?
Dilip Sarwate
@DilipSarwate, Tak, zdałem sobie sprawę po opublikowaniu tego, że pominąłem część „R”. Edytowałem, aby teraz uwzględnić RMSE. Uważam, że sugerowana wersja jest jedyną możliwą odpowiedzią w tym przypadku.
user20160,
@ whuber To dobra uwaga. Spróbuję edytować coś takiego.
user20160,
2
@Hiyam Jeśli jest tylko 1 wartość, wówczas RMSE z definicji musi być równe MAE. Ponieważ jest tylko 1 błąd, podniesienie go do kwadratu i zrobienie roota po prostu zwraca wartość bezwzględną pierwotnego błędu.
mkt - Przywróć Monikę