Oceniam model fizyczny i chciałbym wiedzieć, której z metod powinienem tutaj użyć (między RMSE a współczynnikiem determinacji R2)
Problem jest następujący: Mam funkcję, która wyświetla prognozy dla wartości wejściowej x, . Mam też faktyczną obserwację tej wartości, którą nazywam y .
Moje pytanie brzmi, jakie są plusy i minusy obu RMSE lub . Widziałem, jak oba z nich są używane w papierach z powodu problemu, nad którym pracuję.
This value shows how well future outcomes can be predicted by the model
- jest to bardzo mylące i skłania się ku zwykłemu błędowi . Nie ma gwarancji, że wysoki współczynnik determinacji w danym modelu odnosi się do tego, jak dobrze przewidywane będą przyszłe wyniki.Bez względu na to, jaki pomiar błędu podajesz, rozważ podanie pełnego wektora wyniku w załączniku. Ludzie, którzy lubią porównywać z twoją metodą, ale wolą inny pomiar błędu, mogą czerpać taką wartość z tabeli.
Można to wyrazić za pomocą łatwej do zrozumienia formuły, w której buduje się stosunek sumy kwadratów reszt i dzieli przez średnią:
Możesz osiągnąć niski poziomR MS.mi tylko dzięki wysokiej precyzji (pojedyncze, ale duże wartości odstające silnie karają) i bez systematycznego błędu. W pewien sposób niskiR MS.mi gwarantuje lepszą jakość niż wysoka R2) robi.
Ten numer ma jednostkę i nie jest łatwy do interpretacji dla osób, które nie znają twoich danych. Można go na przykład podzielić ze średnią danych, aby uzyskać ar e l . R MS.mi . Uważaj, to nie jedyna definicjar e l . R MS.mi . Niektóre osoby wolą dzielić według zakresu swoich danych niż dzielić według średniej.
As other people mentioned, the choice might be dependent on your field and state of the art. Is there a hugely accepted method to compare too? Use the same measurement as they do and you are able to directly link your methods benefits easily in the discussion.
źródło
Both the Root-Mean-Square-Error (RMSE) and coefficient of determination (R2 ) oferują różne, ale uzupełniające się informacje, które należy ocenić podczas oceny modelu fizycznego. Nie jest też „lepszy”, ale niektóre raporty mogą koncentrować się bardziej na jednej metryki w zależności od konkretnej aplikacji.
Użyłbym tego jako bardzo ogólnego przewodnika, aby zrozumieć różnicę między tymi dwoma danymi:
RMSE daje poczucie tego, jak blisko (lub daleko) Twoje przewidywane wartości są z rzeczywistych danych, które próbujesz modelu. Jest to przydatne w różnych aplikacjach, w których chcesz zrozumieć dokładność i precyzję prognoz modelu (np. Modelowanie wysokości drzewa).
Plusy
Cons
Współczynnik korelacji (R2) ) jest przydatny, gdy próbujesz zrozumieć, jak dobrze wybrane zmienne niezależne wyjaśniają zmienność zmiennych zależnych. Jest to przydatne, gdy próbujesz wyjaśnić, jakie czynniki mogą napędzać leżący u podstaw proces zainteresowania (np. Zmienne klimatyczne i warunki glebowe związane z wysokością drzewa).
Plusy
Cons
Oczywiście powyższe będzie uzależnione od wielkości próby i projektu próbkowania oraz ogólnego zrozumienia, że korelacja nie implikuje związku przyczynowego.
źródło
Istnieje również MAE, Mean Absolute Error. W przeciwieństwie do RMSE, nie jest zbyt wrażliwy na duże błędy. Z tego, co przeczytałem, niektóre pola wolą RMSE, inne MAE. Lubię używać obu.
źródło
W rzeczywistości, dla naukowców statystycznych powinien znać najlepsze dopasowanie modelu, wtedy RMSE jest bardzo ważny dla tych ludzi w jego solidnych badaniach. Jeśli RMSE jest bardzo bliski zeru, wtedy model jest najlepiej dopasowany.
Współczynnik determinacji jest dobry dla innych naukowców, takich jak rolnictwo i inne dziedziny. Jest to wartość z zakresu od 0 do 1. Jeśli jest to 1, 100% wartości odpowiada obserwowanym zestawom danych. Jeśli wynosi 0, to dane są całkowicie niejednorodne. Dr.SK. Khadar Babu, VIT University, Vellore, TamilNadu, Indie.
źródło
Jeśli do każdego elementu jednego z wektorów zostanie dodana pewna liczba, zmieni się RMSE. To samo, jeśli wszystkie elementy jednego lub obu wektorów są pomnożone przez liczbę. Następuje kod R;
źródło
Ostatecznie różnicą jest po prostu standaryzacja, ponieważ obie prowadzą do wyboru tego samego modelu, ponieważ RMSE razy liczba obserwacji znajduje się w liczniku lub do kwadratu R, a mianownik tego drugiego jest stały we wszystkich modelach (wystarczy wykreślić jedną miarę względem inne dla 10 różnych modeli).
źródło