Wdrażam weryfikację krzyżową i obliczanie wskaźników błędów, takich jak RMSE, , MAE, MSE itp.
Czy RMSE i MAE mogą mieć tę samą wartość?
cross-validation
rms
mae
Perl
źródło
źródło
Odpowiedzi:
Tak, teoretycznie. Najprostszym przypadkiem, jaki mogę sobie wyobrazić, jest zestaw danych, w którym wszystkie błędy predykcji (tj. Wartości resztowe) wynoszą dokładnie 1. RMSE i MAE zwrócą identyczne wartości 1. Można również skonstruować inne scenariusze, ale żaden nie wydaje się bardzo prawdopodobny.±
EDYCJA: Dzięki @DilipSarwate za wskazanie (dalej rozwinięte przez @ user20160 w ich doskonałej odpowiedzi), że ten wynik jest możliwy wtedy i tylko wtedy, gdy bezwzględne wartości wszystkich błędów prognoz są identyczne. Innymi słowy, nie ma nic specjalnego w wartości 1; każda inna liczba działałaby zamiast 1.±
źródło
Średni błąd bezwzględny (MAE) może być równy średniemu kwadratowemu błędowi (MSE) lub pierwszoplanowemu średniemu kwadratowemu błędowi (RMSE) w określonych warunkach, które pokażę poniżej. Warunki te są mało prawdopodobne w praktyce.
Czynności wstępne
Niechoznacza wartość bezwzględną reszty dla tego punktu danych i niech będzie wektorem zawierającym bezwzględne reszty dla wszystkich punktów w zbiorze danych. Niech oznacza wektor , MAE, MSE i RMSE można zapisać jako:rja= |yja-y^ja| ja r = [rja, ... ,rn]T. n 1⃗ n × 1
MSE
Ustawienie MSE równego MAE i przegrupowanie daje:
MSE i MAE są równe dla wszystkich zestawów danych, w których wartości bezwzględne rozwiązują powyższe równanie. Dwa oczywiste rozwiązania to: (błąd zerowy) i (reszty to wszystkie , jak wspomniano mkt). Ale istnieje nieskończenie wiele rozwiązań.r =0⃗ r =1⃗ ± 1
Można interpretować równania geometrycznie następująco: LHS kropka produkt i . Produkt o zerowej kropce oznacza ortogonalność. Zatem MSE i MAE są równe, jeśli odjęcie 1 od każdej absolutnej reszty daje wektor, który jest ortogonalny do oryginalnych absolutnych reszt.( 2 ) r -1⃗ r
Ponadto, wypełniając kwadrat, równanie można przepisać jako:( 2 )
To równanie opisuje wymiarową kulę wyśrodkowaną na o promieniu . MSE i MAE są równe wtedy i tylko wtedy, gdy absolutne reszty leżą na powierzchni tej hipersfery.n [12), ... ,12)]T. 12)n--√
RMSE
Ustawienie wartości RMSE równej MAE i zmiana kolejności daje:
gdzie matrycą tożsamości. Zestaw rozwiązaniem jest miejsce zerowa od ; to znaczy zbiór wszystkich taki, że . Aby znaleźć przestrzeń zerową, zwróć uwagę, że jest macierzą z elementami ukośnymi równymi i wszystkimi innymi elementami równymi . Instrukcja odpowiada układowi równań:ja ZA r A r =0⃗ ZA n × n n - 1 - 1 A r =0⃗
Lub przestawianie rzeczy:
Oznacza to, że każdy element musi być równy średniej pozostałych elementów. Jedynym sposobem spełnienia tego wymogu jest wyrównanie wszystkich pierwiastków (ten wynik można również uzyskać, biorąc pod uwagę składową składową ). Dlatego zestaw rozwiązań składa się ze wszystkich nieujemnych wektorów z identycznymi wpisami:rja ZA
Tak więc RMSE i MAE są równe wtedy i tylko wtedy, gdy bezwzględne wartości reszt są równe dla wszystkich punktów danych.
źródło