Oznaczmy prawdziwą wartość zainteresowania jako a wartość oszacowaną za pomocą jakiegoś algorytmu jako \ hat {\ theta} .θθ^
Korelacja mówi ci, ile są powiązane i . Daje wartości od do , gdzie to brak zależności, jest bardzo silna, zależność liniowa, a to odwrotna zależność liniowa (tzn. Większe wartości oznaczają mniejsze wartości lub odwrotnie versa). Poniżej znajduje się ilustrowany przykład korelacji.θθ^−1101−1θθ^
(źródło: http://www.mathsisfun.com/data/correlation.html )
Średni błąd bezwzględny wynosi:
MAE=1N∑i=1N|θ^i−θi|
Korzeń błąd średni kwadratowy wynosi:
RMSE=1N∑i=1N(θ^i−θi)2−−−−−−−−−−−−−−⎷
Względny błąd bezwzględny :
RAE=∑Ni=1|θ^i−θi|∑Ni=1|θ¯¯¯−θi|
gdzie to średnia wartość .θ¯¯¯θ
Błąd względny pierwiastka z kwadratu:
RRSE=∑Ni=1(θ^i−θi)2∑Ni=1(θ¯¯¯−θi)2−−−−−−−−−−−−−−⎷
Jak widać, wszystkie statystyki porównują prawdziwe wartości z ich szacunkami, ale robią to w nieco inny sposób. Wszystkie mówią ci „jak daleko” są twoje szacunkowe wartości od prawdziwej wartości . Czasami stosuje się pierwiastki kwadratowe, a czasem wartości bezwzględne - dzieje się tak dlatego, że przy stosowaniu pierwiastków kwadratowych wartości ekstremalne mają większy wpływ na wynik (zobacz Dlaczego kwadratowa różnica zamiast przyjmować wartość bezwzględną w odchyleniu standardowym? Lub na Mathoverflow ).θ
W i po prostu patrzysz na „średnią różnicę” między tymi dwiema wartościami - więc interpretujesz je w porównaniu ze skalą twojej wartościowości (tj. Mathrm 1 punkt to różnica 1 punktu między i ).MAERMSEMSEθθ^θ
W i te różnice przez odmianę więc mają one skalę od 0 do 1, a jeśli pomnożysz tę wartość przez 100, otrzymasz podobieństwo w skali 0-100 (tj. Procent ). Wartości lubpowiedzieć ci, jak bardzo różni się od jego średniej wartości - więc możesz powiedzieć, że chodzi o to, jak bardzo różni się od siebie (porównaj z wariancją ). Z tego powodu miary nazywane są „względnymi” - dają wynik związany ze skalą .RAERRSEθ∑(θ¯¯¯−θi)2∑|θ¯¯¯−θi|θθθ
Sprawdź także te slajdy .