Dla wariancji nieważonej istnieje wariancja próbki skorygowana o błąd systematyczny, gdy średnią oszacowano na podstawie tych samych danych: Var(X):=1
Patrzę na ważoną średnią i wariancję i zastanawiam się, jaka jest odpowiednia korekta odchylenia dla ważonej wariancji. Używając:
„Naiwna”, niepoprawiona wariancja, której używam, jest następująca:
Zastanawiam się więc, czy poprawny jest sposób korygowania błędu systematycznego
A)
lub B)
lub C)
A) nie ma dla mnie sensu, gdy ciężary są małe. Wartość normalizacyjna może wynosić 0 lub nawet być ujemna. Ale co powiesz na B) ( to liczba obserwacji) - czy jest to prawidłowe podejście? Czy masz jakieś referencje, które to pokazują? Wierzę „Aktualizacja szacunków średnich i wariancji: ulepszona metoda”, DHD West, 1979 używa tego. Trzeci, C) to moja interpretacja odpowiedzi na to pytanie: /mathpro/22203/un Niezależnie- oszacowanie-wariancji-----minormalizowanej- ważonej-
Dla C) Właśnie zdałem sobie sprawę, że mianownik wygląda bardzo podobnie . Czy jest tu jakieś ogólne połączenie? Myślę, że to nie do końca się zgadza; i oczywiście istnieje związek, który próbujemy obliczyć wariancję ...
Wszystkie trzy wydają się „przetrwać” kontrolę rozsądku ustawienia wszystkich . Którego powinienem użyć, w jakich lokalach? '' Aktualizacja: '' whuber zasugerował, aby również przeprowadzić kontrolę poczytalności z ω 1 = ω 2 = .5 i wszystkimi pozostałymi ω małe. Wydaje się, że wyklucza to A i B.
Odpowiedzi:
Przeszedłem matematykę i skończyłem z wariantem C:
źródło
Zarówno A, jak i C są poprawne, ale to, którego użyjesz, zależy od rodzaju używanych wag:
Powodem, dla którego C jest koniecznie stronniczy, jest to, że jeśli nie użyje się wag typu „powtórz”, tracisz możliwość zliczenia całkowitej liczby obserwacji (wielkości próbki), a zatem nie możesz użyć współczynnika korekcji.
Aby uzyskać więcej informacji, sprawdź niedawno opublikowany artykuł w Wikipedii: http://en.wikipedia.org/wiki/Weighted_arithmetic_mean#Weighted_sample_variance
źródło