Czy wariancja jest bardziej fundamentalną koncepcją niż odchylenie standardowe?

18

Na tej stronie psychometrii przeczytałem to

[A] Ta wariancja głębokiego poziomu jest bardziej fundamentalną koncepcją niż odchylenie standardowe.

Witryna tak naprawdę nie wyjaśnia dalej, dlaczego wariancja ma być bardziej fundamentalna niż standardowe odchylenie, ale przypomniała mi, że przeczytałem kilka podobnych rzeczy na tej stronie.

Na przykład w tym komentarzu @ kjetil-b-halvorsen pisze, że „odchylenie standardowe jest dobre dla interpretacji, raportowania. Dla opracowania teorii wariancja jest lepsza”.

Wyczuwam, że te twierdzenia są powiązane, ale tak naprawdę ich nie rozumiem. Rozumiem, że pierwiastek kwadratowy wariancji próbki nie jest obiektywnym estymatorem odchylenia standardowego populacji, ale na pewno musi być coś więcej.

Być może termin „podstawowy” jest zbyt niejasny dla tej witryny. W takim przypadku być może możemy zoperacjonalizować moje pytanie jako pytanie, czy wariancja jest ważniejsza niż odchylenie standardowe z punktu widzenia rozwoju teorii statystycznej. Dlaczego? Dlaczego nie?

user1205901 - Przywróć Monikę
źródło
Czy to nie jest to samo? To tak, jakby 1 + 1 to to samo co 2 * 1?
SmallChess,
2
Wariancja jest drugim kumulantem, . Artykuł w Wikipedii na temat kumulantów powinien zaimponować każdemu, jak naturalni i ważni są, nie tylko do badania zmiennych losowych, ale także w fizyce i kombinatoryce. Odchylenie standardowe nie korzysta z właściwości wieloliniowości (która ma podstawowe znaczenie dla wykonywania obliczeń), a także rozszerzenia kumulantów na rozkłady wielowymiarowe. κ2
whuber

Odpowiedzi:

16

Odpowiedzi Roberta i Bey podają część historii (tzn. Chwile są zwykle uważane za podstawowe właściwości rozkładów, a konwencjonalne odchylenie standardowe jest definiowane raczej jako drugi centralny moment, a nie na odwrót), ale stopień, w jakim te rzeczy są naprawdę fundamentalne, zależy częściowo od tego, co rozumiemy przez ten termin.

Na przykład nie byłoby problemu nie do pokonania, gdyby nasze konwencje poszły w drugą stronę - nic nie stoi na przeszkodzie, abyśmy umownie określili inną sekwencję wielkości zamiast zwykłych momentów, powiedzmy dla p = 1 , 2 , 3 , . . . (zauważ, że μmi[(X-μ)p]1/pp=1,2),3),...μwpasowuje się zarówno w sekwencję momentów, jak i w ten pierwszy jako pierwszy element), a następnie definiuje momenty - i wszelkie obliczenia w odniesieniu do momentów - w odniesieniu do nich. Zauważ, że wszystkie te wielkości są mierzone w oryginalnych jednostkach, co stanowi jedną przewagę nad momentami (które są w potęgach oryginalnych jednostek, a więc trudniejsze do interpretacji). To sprawiłoby, że odchylenie standardowe populacji byłoby zdefiniowaną wielkością i wariancją zdefiniowaną pod względem tego.p

Jednak spowodowałoby, że wielkości takie jak funkcja generowania momentu (lub jakiś odpowiednik odnoszący się do nowych wielkości zdefiniowanych powyżej) byłyby mniej „naturalne”, co spowodowałoby, że rzeczy byłyby nieco bardziej niezręczne (ale niektóre konwencje są trochę podobne). Istnieją pewne dogodne właściwości MGF, które nie byłyby tak wygodne do rzucania w drugą stronę.

Moim zdaniem bardziej podstawowe (ale powiązane z tym) jest to, że istnieje szereg podstawowych właściwości wariancji, które są wygodniejsze, gdy są zapisane jako właściwości wariancji niż gdy są zapisane jako właściwości odchylenia standardowego (np. Wariancja sum niezależnych zmienne losowe to suma wariancji).

Ta addytywność jest właściwością, która nie jest dzielona przez inne miary rozproszenia i ma wiele ważnych konsekwencji.

[Istnieją podobne relacje między innymi kumulanty, więc jest to sensu co może chcemy określić, co w stosunku do momentów bardziej ogólnie.]

Wszystkie te powody są zapewne konwencją lub wygodą, ale do pewnego stopnia jest to kwestia punktu widzenia (np. Z niektórych punktów widzenia momenty są dość ważnymi wielkościami, z innych nie są aż tak ważne). Może się zdarzyć, że bit „na głębokim poziomie” ma sugerować jedynie „kjetil” „przy opracowywaniu teorii”.

Zgadzam się z punktem Kjetila, który poruszyłeś w swoim pytaniu; do pewnego stopnia ta odpowiedź jest jedynie falistą dyskusją na ten temat.

Glen_b - Przywróć Monikę
źródło
Powiedziałbym, że oba są w równym stopniu, każdy z własnym zestawem udogodnień towarzyszących.
JM nie jest statystykiem
2

Wariancja jest definiowana przez pierwszy i drugi moment rozkładu. Natomiast odchylenie standardowe bardziej przypomina „normę” niż chwilę. Chwile są podstawowymi właściwościami rozkładu, podczas gdy normy są tylko sposobem na rozróżnienie.


źródło
2

Wariancja jest bardziej fundamentalna niż odchylenie standardowe, ponieważ odchylenie standardowe jest definiowane jako „pierwiastek kwadratowy wariancji”, np. Jej definicja zależy całkowicie od wariancji.

Z kolei wariancja jest definiowana - całkowicie niezależnie - jako „oczekiwanie kwadratowej różnicy między próbką a średnią”.

Robert de Graaf
źródło
3
Widziałbym to bardziej jako raport na temat tego, w jaki sposób (często) używamy terminów, na przykład w nauczaniu, a nie jako refleksję na temat tego, co fundamentalne. Zupełnie możliwe jest wprowadzenie odchylenia standardowego bez wspominania o wariancji (jeszcze), a wiele tekstów i kursów robi to dokładnie tak samo, jak można mówić o twierdzeniu Pitagorasa bez konieczności używania specjalnych nazw dla kwadratowych wielkości. Historycznie termin wariancja w sensie statystycznym występuje po odchyleniu standardowym, więc nawet ta forma słów była niemożliwa przez kilka dziesięcioleci.
Nick Cox,
Uświadomiłem sobie, że odchylenie standardowe pojawiło się jako etykieta przed wariancją, próbując sformułować odpowiedź na teraz usunięty komentarz Glena - w tym czasie pomyślałem, że fakt, że starszy termin był teraz powszechnie definiowany w kategoriach nowego terminu, wzmocniony twierdzenia nowego terminu, że są bardziej fundamentalne niż je osłabiły.
Robert de Graaf,
1
Można znaleźć wszelkiego rodzaju wyjaśnienia. W moim wstępnym nauczaniu SD (do geografów, z których nie wszyscy są silni matematycznie), wcale nie używam terminu wariancja . Szybko zwracam uwagę, że SD jest miarą skali naturalnej dla rozkładów normalnych (gaussowskich), jako odległość między średnią a jednym z przegięć funkcji gęstości. Podejrzewam, że to bardziej dla mojej własnej rozrywki i przyjemności niż dla studentów.
Nick Cox,
0

nXVar[X]=σ2S2σ2Sσ

E[S2]=σ2, E[S]σ,
StijnDeVuyst
źródło
2
nn1
Var[]Var[iXi]=iVar[Xi]Xi
StijnDeVuyst
1
Rzeczywiście, addytywność niezależnych wariancji jest podstawową właściwością, ale to nie jest twój argument.
Nick Cox,
Być może interesujące jest to, że podobnie jak w przypadku średniej można zbudować obiektywny estymator wariancji bez określania konkretnego rozkładu (obiektywne szacunki odchylenia standardowego są specyficzne dla dystrybucji.)
Scortchi - Przywróć Monikę