Zastanawiałem się, jaka jest różnica między wariancją a odchyleniem standardowym.
Jeśli obliczysz te dwie wartości, jasne jest, że odchylenie standardowe wynika z wariancji, ale co to oznacza w kategoriach obserwowanego rozkładu?
Ponadto, dlaczego tak naprawdę potrzebujesz standardowego odchylenia?
Odpowiedzi:
Odchylenie standardowe jest pierwiastkiem kwadratowym wariancji.
Odchylenie standardowe jest wyrażane w tych samych jednostkach, co średnia, podczas gdy wariancja jest wyrażana w jednostkach kwadratowych, ale dla spojrzenia na rozkład możesz użyć jednego z nich, o ile masz jasność co do tego, czego używasz. Na przykład rozkład normalny ze średnią = 10 i sd = 3 jest dokładnie taki sam, jak rozkład normalny ze średnią = 10 i wariancją = 9.
źródło
Nie potrzebujesz obu. Każdy z nich ma inne cele. SD jest zwykle bardziej przydatna do opisania zmienności danych, podczas gdy wariancja jest zwykle znacznie bardziej użyteczna matematycznie. Na przykład suma nieskorelowanych rozkładów (zmiennych losowych) ma również wariancję, która jest sumą wariancji tych rozkładów. To nie byłoby prawdą w przypadku SD. Z drugiej strony SD ma wygodę wyrażania się w jednostkach oryginalnej zmiennej.
źródło
Jeśli John odnosi się do niezależnych zmiennych losowych, gdy mówi „niepowiązane rozkłady”, to jego odpowiedź jest poprawna. Aby jednak odpowiedzieć na twoje pytanie, można dodać kilka punktów:
Średnia i wariancja to dwa parametry określające rozkład normalny.
Margines błędu jest wyrażony jako wielokrotność standardowego odchylenia oszacowania.
Wariancja i stronniczość są miarami niepewności w losowej ilości. Średni błąd kwadratowy oszacowania jest równy wariancji + kwadratowe odchylenie.
źródło
Wariancja zestawu danych mierzy matematyczną dyspersję danych w stosunku do średniej. Jednak, chociaż wartość ta jest teoretycznie poprawna, trudno jest ją zastosować w sensie realnym, ponieważ wartości użyte do jej obliczenia były podniesione do kwadratu. Odchylenie standardowe, jako pierwiastek kwadratowy wariancji, daje wartość, która jest w tych samych jednostkach, co wartości oryginalne, co znacznie ułatwia pracę i interpretację w połączeniu z koncepcją krzywej normalnej.
źródło
Pod względem rozkładu są one równoważne (ale oczywiście nie są wymienne), ale uważaj, że pod względem estymatorów nie są: pierwiastek kwadratowy oszacowania wariancji NIE jest (obiektywnym) estymatorem odchylenia standardowego. Tylko w przypadku umiarkowanie dużej liczby próbek (i w zależności od estymatorów) obie te metody zbliżają się do siebie. W przypadku małych rozmiarów próbek musisz znać parametryczną postać rozkładu, aby przekonwertować między nimi, które mogą stać się lekko okrągłe.
źródło
Obliczając wariancję, wyprostowaliśmy odchylenia. Oznacza to, że jeśli podane dane (obserwacje) są w metrach, staną się metrami kwadratowymi. Mam nadzieję, że nie jest to prawidłowe przedstawienie odchyleń. Zatem, pierwiastek kwadratowy ponownie (SD) to nic innego jak SD.
źródło