Jaka jest różnica między wariancją a odchyleniem standardowym?

127

Zastanawiałem się, jaka jest różnica między wariancją a odchyleniem standardowym.

Jeśli obliczysz te dwie wartości, jasne jest, że odchylenie standardowe wynika z wariancji, ale co to oznacza w kategoriach obserwowanego rozkładu?

Ponadto, dlaczego tak naprawdę potrzebujesz standardowego odchylenia?

Le Max
źródło
12
Prawdopodobnie masz już odpowiedź. Jednak ten link ma najprostsze i najlepsze wytłumaczenie. mathsisfun.com/data/standard-deviation.html
2
Odchylenie standardowe jest przydatne, ponieważ wartość jest w tej samej skali co dane, z których została obliczona. W przypadku pomiaru liczników standardowym odchyleniem będą liczniki. Natomiast odchylenie będzie wyrażone w metrach do kwadratu.
Vladislavs Dovgalecs
Wariacja standardowa może być bezstronna, ale odchylenie standardowe nie, ponieważ funkcja pierwiastka kwadratowego jest nieliniowa.
Daksh Gargas

Odpowiedzi:

84

Odchylenie standardowe jest pierwiastkiem kwadratowym wariancji.

Odchylenie standardowe jest wyrażane w tych samych jednostkach, co średnia, podczas gdy wariancja jest wyrażana w jednostkach kwadratowych, ale dla spojrzenia na rozkład możesz użyć jednego z nich, o ile masz jasność co do tego, czego używasz. Na przykład rozkład normalny ze średnią = 10 i sd = 3 jest dokładnie taki sam, jak rozkład normalny ze średnią = 10 i wariancją = 9.

Peter Flom
źródło
58
tak, to matematyczny sposób na wyjaśnienie tych dwóch parametrów, ALE co to jest logiczne wyjaśnienie? Dlaczego naprawdę potrzebuję dwóch parametrów, aby pokazać to samo (odchylenie wokół średniej arytmetycznej) ...
Le Max
5
Tak naprawdę nie potrzebujesz obu. Jeśli zgłosisz jedno, nie musisz zgłaszać drugiego
Peter Flom
8
Potrzebujemy obu: odchylenie standardowe jest dobre do interpretacji, raportowania. Do opracowania teorii wariancja jest lepsza.
kjetil b halvorsen
4
Zaletą raportowania odchylenia standardowego jest to, że pozostaje on w skali danych. Powiedzmy, że próbka dorosłych wysokości jest w metrach, wówczas odchylenie standardowe będzie również w metrach.
Vladislavs Dovgalecs
5
Var(Xi)=Var(Xi)
49

Nie potrzebujesz obu. Każdy z nich ma inne cele. SD jest zwykle bardziej przydatna do opisania zmienności danych, podczas gdy wariancja jest zwykle znacznie bardziej użyteczna matematycznie. Na przykład suma nieskorelowanych rozkładów (zmiennych losowych) ma również wariancję, która jest sumą wariancji tych rozkładów. To nie byłoby prawdą w przypadku SD. Z drugiej strony SD ma wygodę wyrażania się w jednostkach oryginalnej zmiennej.

Jan
źródło
24

Jeśli John odnosi się do niezależnych zmiennych losowych, gdy mówi „niepowiązane rozkłady”, to jego odpowiedź jest poprawna. Aby jednak odpowiedzieć na twoje pytanie, można dodać kilka punktów:

  1. Średnia i wariancja to dwa parametry określające rozkład normalny.

  2. k

  3. z0t

  4. 68%195.4%299%3

  5. Margines błędu jest wyrażony jako wielokrotność standardowego odchylenia oszacowania.

  6. Wariancja i stronniczość są miarami niepewności w losowej ilości. Średni błąd kwadratowy oszacowania jest równy wariancji + kwadratowe odchylenie.

Michael Chernick
źródło
4
Prawdopodobnie nie powinieneś mówić „parametr naturalny”, czyli średnią podzieloną przez wariancję, a 1 podzieloną przez wariancję: en.wikipedia.org/wiki/Natural_parameter
Neil G
σ
Czy w punkcie 3 nie powinno być „odchylenie standardowe służy do standaryzacji statystyk” zamiast normalizacji?
Harry
15

Wariancja zestawu danych mierzy matematyczną dyspersję danych w stosunku do średniej. Jednak, chociaż wartość ta jest teoretycznie poprawna, trudno jest ją zastosować w sensie realnym, ponieważ wartości użyte do jej obliczenia były podniesione do kwadratu. Odchylenie standardowe, jako pierwiastek kwadratowy wariancji, daje wartość, która jest w tych samych jednostkach, co wartości oryginalne, co znacznie ułatwia pracę i interpretację w połączeniu z koncepcją krzywej normalnej.

Hassan
źródło
To świetna robota, wyjaśniając dlaczego w prostych słowach.
gwg
3
Inną dobrą rzeczą do zrobienia jest to, że każda metryka sd i var mierzy rozpiętość zmiennej wokół średniej. Przyjmowanie pierwiastka kwadratowego wariancji w celu uzyskania odchylenia standardowego można postrzegać jako czynnik skalowania zastosowany w celu przekształcenia metryki z powrotem w jednostki zmiennej.
Matt L.
6

Pod względem rozkładu są one równoważne (ale oczywiście nie są wymienne), ale uważaj, że pod względem estymatorów nie są: pierwiastek kwadratowy oszacowania wariancji NIE jest (obiektywnym) estymatorem odchylenia standardowego. Tylko w przypadku umiarkowanie dużej liczby próbek (i w zależności od estymatorów) obie te metody zbliżają się do siebie. W przypadku małych rozmiarów próbek musisz znać parametryczną postać rozkładu, aby przekonwertować między nimi, które mogą stać się lekko okrągłe.

Kwarc
źródło
4

Obliczając wariancję, wyprostowaliśmy odchylenia. Oznacza to, że jeśli podane dane (obserwacje) są w metrach, staną się metrami kwadratowymi. Mam nadzieję, że nie jest to prawidłowe przedstawienie odchyleń. Zatem, pierwiastek kwadratowy ponownie (SD) to nic innego jak SD.

g ravi
źródło