Co to jest odchylenie standardowe?

31

Co to jest odchylenie standardowe, jak jest obliczane i jakie jest jego zastosowanie w statystyce?

Oren Hizkiya
źródło
7
Nie sądzę, że celem tej witryny jest udzielenie odpowiedzi na pytania uczniów klas szóstych. A moje dziecko w obliczu takiego pytania szukałoby w Google odpowiedzi. Jeśli jest jakaś część definicji, której nie rozumiesz, zapytaj. Ale takie nieokreślone pytanie na tak podstawowy temat wskazuje (w każdym razie dla mnie), że plakat nawet nie próbował znaleźć odpowiedzi. Co będzie dalej „Co to jest liczba i jak są używane?”
PeterR
9
Myślę, że to pytanie jest w porządku. W rzeczywistości był to najbardziej pozytywny przykład na pytanie tematyczne w obszarze 51. Podstawy są w porządku!
Peter Smit
6
Zgadzam się, to ważne pytanie. Jest to również dobrze określone, ponieważ wymaga na przykład użycia i obliczeń. Z pewnością celem strony jest stworzenie repozytorium dla WSZYSTKICH pytań statystycznych.
Joel
5
Zgadzam się z Joelem. Odchylenie standardowe jest ważną koncepcją w statystyce. Czy nie byłoby absurdalne, gdybyś nie mógł zadać na stronie pytania o zadawanie pytań statystycznych.
Parbury,
4
Jako nauczyciel liceum w poprzednim życiu powiem, że nie ma głupich pytań. W momencie, gdy oznaczysz pytanie jako niegodne, od razu pozbędziesz się najskuteczniejszego sposobu uczenia się, czyli zadawania pytań! (Odpowiem na to pytanie poniżej).
Adhesh Josh

Odpowiedzi:

30

Odchylenie standardowe to liczba reprezentująca „rozproszenie” lub „rozproszenie” zestawu danych. Istnieją inne miary rozprzestrzeniania się, takie jak zasięg i wariancja.

Oto kilka przykładowych zestawów danych i ich standardowe odchylenia:

[1,1,1]     standard deviation = 0   (there's no spread)  
[-1,1,3]    standard deviation = 1.6 (some spread) 
[-99,1,101] standard deviation = 82  (big spead)

Powyższe zestawy danych mają tę samą średnią.

Odchylenie oznacza „odległość od średniej”.

„Standard” oznacza tutaj „znormalizowany”, co oznacza, że ​​odchylenie standardowe i średnia są w tych samych jednostkach, w przeciwieństwie do wariancji.

Na przykład, jeśli średnia wysokość wynosi 2 metry , odchylenie standardowe może wynosić 0,3 metra , podczas gdy wariancja wyniesie 0,09 metra kwadratowego .

Dogodnie jest wiedzieć, że co najmniej 75% punktów danych zawsze mieści się w granicach 2 odchyleń standardowych średniej (lub około 95%, jeśli rozkład jest normalny).

Na przykład, jeśli średnia wynosi 100, a odchylenie standardowe wynosi 15, to co najmniej 75% wartości wynosi między 70 a 130.

Jeśli rozkład jest normalny, 95% wartości mieści się w przedziale od 70 do 130.

Ogólnie rzecz biorąc, wyniki testu IQ są zwykle rozłożone i wynoszą średnio 100. Ktoś, kto jest „bardzo jasny”, jest o dwa odchylenia standardowe powyżej średniej, co oznacza wynik testu IQ wynoszący 130.

Neil McGuigan
źródło
Neil, dziękuję za odpowiedź, czy mógłbyś bardziej szczegółowo wyjaśnić część „standard” w terminie „odchylenie standardowe”. Jeśli jest to właściwe, proszę dotknąć tego samego „standardowego” w „standardowym błędzie średniej” terminu. Z góry dziękuję.
stan
Co do twoich ostatnich edycji: w jakim sensie SD jest „znormalizowany”? Zwykle staje się podstawą do standaryzacji, ale sama nie jest standaryzowana (na przykład przeskalowanie go o pewne oszacowanie zmienności próbkowania).
whuber
Znormalizowany jest w tej samej jednostce co średnia
Neil McGuigan,
Przykład o średniej wysokości 2 metrów jest dobrym przykładem konieczności dbania o użycie miejsc po przecinku. Ten sam przykład można wykonać w centymetrach, gdzie odchylenie standardowe wynoszące 30 centymetrów logicznie wynika z wariancji 900 centymetrów.
Robert Jones
Mam wrażenie, że należy ich unikać w podstawowych jednostkach miary. Weźmy pod uwagę wyniki SD o wartości 0,133 w metrach przeliczonej na decymetry, centymetry i milimetry. Czy ktoś chciałby to wyjaśnić, proszę?
Robert Jones
9

Cytat z Wikipedii .

Pokazuje, jak duże jest odchylenie od „średniej” (średniej lub oczekiwanej / zapisanej w budżecie wartości). Niskie odchylenie standardowe wskazuje, że punkty danych wydają się być bardzo zbliżone do średniej, natomiast wysokie odchylenie standardowe wskazuje, że dane są rozłożone w szerokim zakresie wartości.

c4il
źródło
5

Opisując zmienną, zwykle podsumowujemy ją za pomocą dwóch miar: miary środka i miary rozproszenia. Typowe miary środka obejmują średnią, medianę i tryb. Częstą miarą spreadu jest wariancja i zakres międzykwartylowy.

Wariancja (reprezentowana przez grecką małą sigmę podniesioną do potęgi drugiej) jest powszechnie stosowana, gdy podaje się średnią. Wariancja jest średnim kwadratowym odchyleniem zmiennej. Odchylenie oblicza się, odejmując średnią z każdej obserwacji. Jest to podniesione do kwadratu, ponieważ w przeciwnym razie suma byłaby równa zero, a podniesienie do kwadratu usuwa ten problem, zachowując względny rozmiar odchyleń. Problem z użyciem wariancji jako miary rozpiętości polega na tym, że jest ona wyrażona w jednostkach kwadratowych. Na przykład, jeśli naszą zmienną będącą przedmiotem zainteresowania była wysokość mierzona w calach, wówczas wariancja byłaby zgłaszana w calach kwadratowych, co nie ma większego sensu. Odchylenie standardowe (reprezentowane przez grecką małą sigmę) jest pierwiastkiem kwadratowym wariancji i zwraca miarę spreadu do oryginalnych jednostek.

Używając odchylenia standardowego, należy uważać na wartości odstające, ponieważ wypaczą one odchylenie standardowe (i średnią), ponieważ nie są odpornymi miarami rozprzestrzeniania się. Prosty przykład zilustruje tę właściwość. Średnia z moich strasznych wyników po uderzeniu krykieta 13, 14, 16, 23, 26, 28, 33, 39 i 61 wynosi 28,11. Jeśli uznamy 61 za wartość odstającą i usuniemy ją, średnia wyniesie 24.

Graham Cookson
źródło
1
σ2σ
2

Oto jak odpowiedziałbym na to pytanie za pomocą diagramu.

Załóżmy, że ważymy 30 kotów i obliczamy średnią wagę. Następnie tworzymy wykres rozproszenia z ciężarem na osi y i tożsamością kota na osi x. Średnią masę można narysować jako linię poziomą. Następnie możemy narysować pionowe linie, które łączą każdy punkt danych z linią średnią - są to odchylenia każdego punktu danych od średniej i nazywamy je resztkami. Teraz te resztki mogą być przydatne, ponieważ mogą nam powiedzieć coś o rozprzestrzenianiu się danych: jeśli jest wiele dużych reszt, to koty bardzo różnią się masą. I odwrotnie, jeśli pozostałości są głównie małe, wówczas koty są dość blisko skupione wokół średniej masy. Więc jeśli moglibyśmy mieć jakieś dane, które mówią nam średniądługości reszty w tym zbiorze danych, byłby to przydatny sposób na określenie, jak duży jest rozpiętość w danych. Odchylenie standardowe jest w rzeczywistości długością średniej resztkowej.

Kontynuowałbym to, podając obliczenia dla sd, wyjaśniając, dlaczego obliczyć kwadrat, a następnie pierwiastek kwadratowy (lubię krótkie i słodkie wyjaśnienie Vaibhav'a). Następnie wspomniałbym o problemach wartości odstających, jak Graham w swoim ostatnim akapicie.

Freya Harrison
źródło
1

Jeśli wymagana jest informacja o rozkładzie średniej, przydatne jest odchylenie standardowe.

Suma różnicy między każdą wartością a średnią wynosi zero (oczywiście, ponieważ wartości są równomiernie rozłożone wokół średniej), dlatego każdą różnicę obliczamy kwadratowo, aby przekonwertować wartości ujemne na dodatnie, zsumować je w całej populacji i wziąć ich pierwiastek kwadratowy. Wartość tę dzieli się następnie przez liczbę próbek (lub wielkość populacji). Daje to standardowe odchylenie.

Vaibhav Garg
źródło
„. stąd kwadrat każdej różnicy ...” Możemy wziąć wartość bezwzględną, aby pozbyć się również wartości ujemnych. Dlaczego więc poprawianie kwadratu jest lepszą metodą, skoro na końcu musimy wziąć pierwiastek kwadratowy? Dlaczego nie po prostu zsumować bezwzględnych wartości odchyleń?
Dilip Sarwate
Widziałeś ten? link
Vaibhav Garg
45
1
@DilipSarwate, z całym szacunkiem, Dowód autorytetu nie robi na mnie wrażenia. Przypuszczenie, że „stąd” jest „autorytatywne”, jest „Słomkowym człowiekiem”, który wolałbym zignorować. Poziom szczegółowości w każdym stwierdzeniu jest proporcjonalny do nachylenia i / lub znaczenia pedagogicznego tego samego w danym kontekście. Zakładam, że osoba, która pyta „Co to jest odchylenie standardowe, jak to jest… tak dalej?” mogą nie chcieć być obciążeni rygorystycznymi matematycznymi definicjami tego samego. Uproszczenie jest celowe i, zapewniam cię, nie wynika z nieświadomości.
Vaibhav Garg
1
A co, módlcie się, powiedzcie, że… „stąd my staramy się…” poza dowodem z autorytetu, który nie robi na was wrażenia? Nie ma żadnego logicznego powodu, dla którego kwadraty są automatycznie rozwiązaniem problemu, jak sugeruje twoje „stąd”.
Dilip Sarwate
1

Lubię myśleć o tym w następujący sposób: odchylenie standardowe to średnia odległość od średniej . Jest to bardziej użyteczne koncepcyjnie niż matematyczne, ale jest to dobry sposób na wyjaśnienie go niewtajemniczonym.

Behacad
źródło
0

Odchylenie standardowe jest pierwiastkiem kwadratowym drugiego centralnego momentu rozkładu. Centralnym momentem jest oczekiwana różnica od oczekiwanej wartości rozkładu. Pierwszy moment centralny wynosiłby zwykle 0, więc definiujemy drugi moment centralny jako wartość oczekiwaną odległości kwadratowej zmiennej losowej od jej wartości oczekiwanej.

Aby umieścić go w skali bardziej zgodnej z pierwotnymi obserwacjami, bierzemy pierwiastek kwadratowy z tego drugiego centralnego momentu i nazywamy to odchyleniem standardowym.

Odchylenie standardowe jest własnością populacji. Mierzy, ile przeciętnej „dyspersji” ma ta populacja. Czy wszystkie zasłony są skupione wokół środka, czy też są szeroko rozpowszechnione?

Aby oszacować odchylenie standardowe populacji, często obliczamy odchylenie standardowe „próby” od tej populacji. W tym celu należy pobrać obserwacje z tej populacji, obliczyć średnią z tych obserwacji, a następnie obliczyć pierwiastek kwadratowy średniego odchylenia kwadratowego z tej „średniej próbki”.

Aby uzyskać obiektywny estymator wariancji, tak naprawdę nie obliczasz średniego kwadratowego odchylenia od średniej próbki, ale dzielisz przez (N-1), gdzie N jest liczbą obserwacji w próbie. Należy zauważyć, że to „próbne odchylenie standardowe” nie jest obiektywnym estymatorem odchylenia standardowego, ale kwadrat „próbki standardowego odchylenia” jest obiektywnym estymatorem wariancji populacji.

Baltimark
źródło
6
jest to niezwykle niejasna odpowiedź. Spróbuj napisać po angielsku.
Neil McGuigan
1
Może tak. to osoba zadająca to pytanie, osoba, która wyszła z ulicy lub osoba, która przynajmniej otworzyła książkę statystyk. Mówienie komuś, że odchylenie standardowe jest tylko pierwiastkiem kwadratowym wariancji, całkowicie nasuwa pytanie.
Baltimark,
-1

Najlepszym sposobem, w jaki zrozumiałem odchylenie standardowe, jest wymyślenie fryzjera! (Musisz zebrać dane z fryzjera i uśrednić jej szybkość strzyżenia, aby ten przykład zadziałał).

Obcinanie włosów przez osobę zajmuje fryzjerowi średnio 30 minut.

Załóżmy, że wykonujesz obliczenia (większość pakietów oprogramowania zrobi to za Ciebie) i okaże się, że standardowe odchylenie wynosi 5 minut. Oznacza to, co następuje:

  • fryzjer obcina włosy 68% swoich klientów w ciągu 25 minut i 35 minut
  • fryzjer obcina włosy 96% swoich klientów w ciągu 20 i 40 minut

Skąd to wiem? Musisz spojrzeć na krzywą normalną, gdzie 68% mieści się w granicach 1 odchylenia standardowego, a 96% mieści się w 2 odchyleniach standardowych średniej (w tym przypadku 30 minut). Więc dodajesz lub odejmujesz standardowe odchylenie od średniej.

Jeśli pożądana jest spójność, jak w tym przypadku, im mniejsze odchylenie standardowe, tym lepiej. W takim przypadku fryzjer spędza z każdym klientem maksymalnie około 40 minut. Musisz szybko obciąć włosy, aby prowadzić udany salon!

Adhesh Josh
źródło
Nie sądzę, żebyś poprawił swoją odpowiedź, Adhesh. Masz tutaj sprzeczne informacje. Sprawdź, czy zgadzasz się z moimi zmianami, dobrze?
rolando2
1
Opisałeś interpretację odchylenia standardowego tylko w przypadku rozkładu normalnego. Reguła „68%” i (i zasada 95%) mają zastosowanie tylko do normalnie dystrybuowanych danych. Przynajmniej stwierdzaj, że dwa punkty wypunktowania są prawdziwe tylko wtedy, gdy czasy ostrzyżenia przebiegają normalnie.
Makro
Makro, wspomniałem o krzywej normalnej i jest pewne, że jeśli użyjesz krzywej normalnej, dane będą miały rozkład normalny.
Adhesh Josh
@ rolando2 Nie rozumiem, co jest nie tak z wyjaśnieniem
Adhesha
@Amarald - czy kliknąłeś „31 stycznia o 1:06”, aby zobaczyć wersje przed i po edycji? Wydaje mi się, że odpowiedź jest silniejsza po, choć Makro również ma ważny punkt.
rolando2