Chciałbym uzyskać koncepcyjne zrozumienie Root Mean Squared Error (RMSE) i Mean Bias Deviation (MBD). Po obliczeniu tych miar dla własnych porównań danych często byłem zakłopotany stwierdzeniem, że RMSE jest wysoki (na przykład 100 kg), podczas gdy MBD jest niski (na przykład mniej niż 1%).
Mówiąc dokładniej, szukam odniesienia (nie online), które zawiera listę i omówienie matematyki tych miar. Jaki jest zwykle akceptowany sposób obliczenia tych dwóch miar i jak powinienem je zgłosić w artykule z czasopisma?
W kontekście tego postu bardzo przydatne byłoby posiadanie zestawu danych „zabawki”, którego można by użyć do opisu obliczenia tych dwóch miar.
Załóżmy na przykład, że mam znaleźć masę (w kg) 200 widgetów wyprodukowanych przez linię montażową. Mam również model matematyczny, który będzie próbował przewidzieć masę tych widżetów. Model nie musi być empiryczny i może być oparty na fizyce. Obliczam RMSE i MBD między rzeczywistymi pomiarami a modelem, stwierdzając, że RMSE wynosi 100 kg, a MBD wynosi 1%. Co to oznacza koncepcyjnie i jak interpretowałbym ten wynik?
Załóżmy teraz, że z wyniku tego eksperymentu stwierdzam, że RMSE wynosi 10 kg, a MBD wynosi 80%. Co to znaczy i co mogę powiedzieć o tym eksperymencie?
Jakie jest znaczenie tych środków i co oznaczają te dwa (razem)? Jakie dodatkowe informacje podaje MBD, gdy rozważa się je z RMSE?
źródło
Odpowiedzi:
Myślę, że te pojęcia są łatwe do wyjaśnienia. Wolałbym więc to tutaj opisać. Jestem pewien, że obejmuje to wiele książek ze statystyk podstawowych, w tym moją książkę „Podstawy biostatystyki dla lekarzy, pielęgniarek i klinicystów”.
Pomyśl o celu z tarczą w środku. Średni błąd kwadratu reprezentuje średnią kwadratową odległość od strzały trafionej w cel i środek. Teraz, jeśli twoje strzały rozrzucają się równomiernie wokół środka, strzelec nie ma uprzedzeń celowniczych, a średni błąd kwadratowy jest taki sam jak wariancja.
Ale ogólnie strzały mogą rozproszyć się wokół punktu oddalonego od celu. Średnia kwadratowa odległość strzałek od środka strzałek jest wariancją. To centrum może być postrzegane jako punkt celowania strzelców. Odległość od środka strzelca lub punktu celowania do środka celu jest wartością bezwzględną odchylenia.
Myśląc o prostokątnym trójkącie, w którym kwadrat przeciwprostokątnej jest sumą kwadratów dwóch boków. Zatem kwadratowa odległość od strzały do celu jest kwadratem odległości od strzały do punktu celowania i kwadratu odległości między środkiem celu a punktem celowania. Uśrednianie wszystkich tych kwadratowych odległości daje średni błąd kwadratowy jako sumę kwadratów odchylenia do kwadratu i wariancji.
źródło
RMSE to sposób pomiaru, jak dobry jest nasz model predykcyjny względem rzeczywistych danych, im mniejszy RMSE, tym lepszy sposób zachowania modelu, to znaczy, jeśli przetestowaliśmy to na nowym zbiorze danych (nie na naszym zestawie treningowym), ale znowu wartość RMSE wynosząca 0,37 w zakresie od 0 do 1 odpowiada za wiele błędów w porównaniu z wartością RMSE wynoszącą 0,01 jako lepszym modelem. BIAS służy do przeszacowania lub niedoszacowania.
źródło
O ile rozumiem, RMSE podaje dokładniejszą wartość błędu między modelem a zaobserwowanym, jednak BIAS, oprócz podania wartości błędu (mniej dokładnej niż RMSE), może również określić, czy model jest dodatnia lub ujemna, jeśli model nie docenia lub nie docenia obserwowanych wartości.
źródło