Pobrałem próbkę punktów danych z populacji. Każdy z tych punktów ma prawdziwą wartość (znaną z podstawowej prawdy) i wartość szacunkową. Następnie obliczam błąd dla każdego próbkowanego punktu, a następnie obliczam RMSE próbki.
Jak mogę wnioskować o pewnym przedziale ufności wokół tego RMSE na podstawie wielkości próbki ?
Gdybym używał średniej, a nie RMSE, nie miałbym problemu z tym, ponieważ mogę użyć standardowego równania
ale nie wiem, czy dotyczy to RMSE, a nie średniej. Czy mogę to jakoś dostosować?
(Widziałem to pytanie , ale nie mam problemów z tym, czy moja populacja jest normalnie rozmieszczona, z tym właśnie ma do czynienia odpowiedź)
confidence-interval
robintw
źródło
źródło
Odpowiedzi:
Z podobnym uzasadnieniem, jak tutaj , mogę pod pewnymi warunkami udzielić odpowiedzi na twoje pytanie.
Niech być twoja prawdziwa wartość dla í t h punkcie danych i x I szacunkowej wartości. Jeśli założymy, że istnieją różnice między wartościami szacowanymi i prawdziwymixi ith x^i
średnią zero (czyli x i są rozmieszczone wokół x I )x^i xi
postępuj zgodnie z rozkładem normalnym
i wszystkie mają to samo odchylenie standardoweσ
w skrócie:
wtedy naprawdę potrzebujesz przedziału ufności dla .σ
Jeśli powyższe założenia są prawdziwe marozkładχ 2 n przyn(nien-1) stopniach swobody. To znaczy
Dlatego to przedział ufności.
Oto program python, który symuluje twoją sytuację
Mam nadzieję, że to pomaga.
Jeśli nie masz pewności, czy założenia mają zastosowanie, lub jeśli chcesz porównać to, co napisałem z inną metodą, zawsze możesz spróbować załadować .
źródło
źródło
źródło