Co mówi nam odchylenie standardowe w rozkładzie nienormalnym

40

W rozkładzie normalnym reguła 68-95-99.7 nadaje odchyleniu standardowemu wiele znaczenia, ale co oznaczałoby odchylenie standardowe w rozkładzie nienormalnym (multimodalnym lub skośnym)? Czy wszystkie wartości danych mieszczą się w granicach 3 odchyleń standardowych? Czy mamy reguły takie jak 68-95-99.7 dla niestandardowych dystrybucji?

Zuhaib Ali
źródło
16
Spójrz na nierówność Czebyszewa .
COOLSerdash
@COOLSerdash świetnie. To doskonale odpowiada na moje pytanie.
Zuhaib Ali,
3
@ COOLSerdash ma tutaj cel, ale pamiętaj, że standardowe stwierdzenie nierówności Czebyszewa dotyczy prawdziwego SD znanego a priori, a nie SD oszacowanego na podstawie próby. Pomoże to przeczytać ten doskonały wątek CV: Czy istnieje przykładowa wersja jednostronnej nierówności Chebesheva?
gung - Przywróć Monikę
Ponadto prawdopodobnie nie powinieneś zadowolić się Czebeszewem od razu - prawdopodobnie możesz zrobić znacznie lepiej, wypaczony lub nie.
Steve S,
1
@ gung to samo dotyczy reguły 68-95-99.7!
Glen_b

Odpowiedzi:

12

Odchylenie standardowe jest jedną szczególną miarą zmiany. Istnieje kilka innych, Mean Absolute Deviation jest dość popularny. Odchylenie standardowe w żadnym wypadku nie jest specjalne. To, co wydaje się wyjątkowe, polega na tym, że rozkład Gaussa jest wyjątkowy.

Jak wskazano w komentarzach, nierówność Czebyszewa jest przydatna do uzyskania poczucia. Jednak jest ich więcej .

Keith
źródło
9

Jest to pierwiastek kwadratowy drugiego centralnego momentu , wariancji. Momenty są związane z funkcjami charakterystycznymi (CF), które są nazywane charakterystycznymi z tego powodu, że określają rozkład prawdopodobieństwa. Tak więc, jeśli znasz wszystkie momenty, znasz CF, stąd znasz cały rozkład prawdopodobieństwa.

Charakterystyczną funkcję rozkładu normalnego definiują tylko dwa momenty: średnia i wariancja (lub odchylenie standardowe). Dlatego w przypadku rozkładu normalnego odchylenie standardowe jest szczególnie ważne, w pewnym sensie stanowi 50% jego definicji.

W przypadku innych rozkładów odchylenie standardowe jest w pewnym sensie mniej ważne, ponieważ mają one inne momenty. Jednak w przypadku wielu rozkładów stosowanych w praktyce pierwsze kilka momentów jest największe, więc są najważniejsze.

Teraz, intuicyjnie, średnia mówi ci, gdzie jest centrum twojej dystrybucji, podczas gdy odchylenie standardowe mówi ci, jak blisko tego centrum są twoje dane.

Ponieważ odchylenie standardowe jest w jednostkach zmiennej, służy również do skalowania innych momentów w celu uzyskania miar, takich jak kurtoza . Kurtosis to bezwymiarowa miara, która mówi ci, jak grube są ogony twojej dystrybucji w porównaniu do normalnej

Aksakal
źródło
1
„Teraz intuicyjnie oznacza, że ​​oznacza to, gdzie znajduje się centrum twojej dystrybucji, podczas gdy odchylenie standardowe mówi, jak blisko tego centrum są twoje dane”. - Czy nie dotyczyłoby to tylko dystrybucji normalnej? W przeciwnym razie mediana jest częściej miarą tendencji centralnej.
Dan Temkin
@ DanTemkin Podczas korzystania z mediany odchylenie standardowe traci swoją wartość do pewnego stopnia. Jest obliczany na podstawie średniej. W przypadku mediany sensowne jest mówienie o kwantylach, co może być sposobem na przejście z wypaczonymi rozkładami. OP nie skupiło się jednak na wypaczonych rozkładach. Tak więc, dla każdego symetrycznego rozkładu, który masz na myśli = mediana, nie ma góry normalnej. Dlatego sensowne jest mówienie o średniej, gdy omawiane jest odchylenie standardowe.
Aksakal
4

Odchylenie standardowe próbki jest miarą odchylenia zaobserwowanych wartości od średniej, w tych samych jednostkach do pomiaru danych. Normalny rozkład, czy nie.

Alexis
źródło