Kurtoza ma mierzyć szczytowość i płaskość rozkładu. Funkcja gęstości rozkładu, jeśli istnieje, może być postrzegana jako krzywa i ma cechy geometryczne (takie jak krzywizna, wypukłość, ...) związane z jej kształtem.
Zastanawiam się więc, czy kurtoza rozkładu jest związana z niektórymi cechami geometrycznymi funkcji gęstości, które mogą wyjaśnić geometryczne znaczenie kurtozy?
Odpowiedzi:
Chwile ciągłego rozkładu i ich funkcje, takie jak kurtoza, mówią bardzo niewiele o wykresie jego funkcji gęstości.
Rozważmy na przykład następujące wykresy.
Każdy z nich jest wykresem funkcji nieujemnej integrującej się z : wszystkie są plikami PDF. Co więcej, wszystkie mają dokładnie takie same chwile - każdą ostatnią nieskończoną liczbę. W ten sposób dzielą wspólną kurtozę (która zdarza się równa )- 3 + 3 e 2 + 2 E 3 + e 41 - 3 + 3 e2)+ 2 e3)+ e4
Wzory dla tych funkcji to
dla i- 1 ≤ s ≤ 1 , k ∈ Z .x > 0 , - 1 ≤ s ≤ 1 , k ∈ Z .
Na rysunku pokazano wartości po lewej stronie i wartości na górze. Lewa kolumna pokazuje plik PDF dla standardowego rozkładu logarytmicznego.ks k
Ćwiczenie 6.21 w Zaawansowanej teorii statystyki Kendalla (Stuart & Ord, wydanie 5) prosi czytelnika, aby pokazał, że wszystkie mają te same chwile.
Podobnie można zmodyfikować dowolny plik pdf, aby utworzyć inny plik PDF o radykalnie innym kształcie, ale z tymi samymi drugimi i czwartymi momentami centralnymi (powiedzmy), które zatem miałyby tę samą kurtozę. Tylko z tego przykładu powinno być całkowicie jasne, że kurtoza nie jest łatwą do interpretacji lub intuicyjną miarą symetrii, jednomodalności, bimodalności, wypukłości lub jakiejkolwiek innej znanej geometrycznej charakterystyki krzywej.
Dlatego też funkcje momentów (i kurtoza jako szczególny przypadek) nie opisują właściwości geometrycznych wykresu pdf. To intuicyjnie ma sens: ponieważ pdf reprezentuje prawdopodobieństwo za pomocą obszaru, możemy prawie dowolnie przesuwać gęstość prawdopodobieństwa z jednej lokalizacji do drugiej, radykalnie zmieniając wygląd pdf, jednocześnie ustalając dowolną skończoną liczbę z góry określonych momentów.
źródło
W przypadku rozkładów symetrycznych (dla których znaczące są nawet momenty wyśrodkowane) kurtoza mierzy geometryczną cechę leżącego u podstaw pliku pdf. Nie jest prawdą, że kurtoza mierzy (lub ogólnie jest związana) z pikiem rozkładu. Zamiast tego kurtoza mierzy, jak daleko rozkład leżący u podstaw jest symetryczny i bimodalny (algebraicznie, idealnie symetryczny i bimodalny rozkład będzie miał kurtozę 1, co jest najmniejszą możliwą wartością, jaką może mieć kurtoza) [0].
W skrócie [1], jeśli zdefiniujesz:
z , a następniemi( X) = μ , V( X) = σ2)
dla .Z= ( X- μ ) / σ
To implikuje, że można postrzegać jako miarę dyspersji wokół jego oczekiwań 1. Innymi słowy, jeśli masz geometryczną interpretację wariancji i oczekiwań, to wynika z kurtozy.Z 2k Z2)
[0] RB Darlington (1970). Czy Kurtosis jest naprawdę „szczytem”? The American Statistician, t. 24, nr 2.
[1] JJA Moors (1986). The Meaning of Kurtosis: Darlington Reexamined. The American Statistician, tom 40, wydanie 4.
źródło
[Uwaga: zostało to napisane w odpowiedzi na inne pytanie na stronie; odpowiedzi zostały połączone z obecnym pytaniem. Właśnie dlatego ta odpowiedź wydaje się odpowiadać na pytanie o innym brzmieniu. Jednak znaczna część postu powinna być tutaj istotna.]
Kurtosis tak naprawdę nie mierzy kształtu dystrybucji. Być może w niektórych rodzinach dystrybucji można opisać kształt, ale bardziej ogólnie kurtoza nie mówi zbyt wiele o rzeczywistym kształcie. Na kształt ma wpływ wiele rzeczy, w tym niezwiązanych z kurtozą.
Jeśli ktoś szuka obrazów kurtozy, pojawia się całkiem sporo takich zdjęć:
które zamiast tego wydają się wykazywać zmienną wariancję, a nie wzrost kurtozy. Dla porównania oto trzy normalne gęstości, które właśnie narysowałem (używając R) z różnymi odchyleniami standardowymi:
Jak widać, wygląda prawie identycznie jak poprzednie zdjęcie. Wszystkie mają dokładnie taką samą kurtozę. Dla porównania, oto przykład, który prawdopodobnie jest bliższy temu, do czego dążył diagram
To zwykle mają na myśli ludzie, gdy mówią o kurtozie wskazującej kształt gęstości. Kurtoza może być jednak subtelna - nie musi tak działać.
Na przykład przy danej wariancji wyższa kurtoza może faktycznie występować z niższym pikiem.
Trzeba też wystrzegać się pokusy (i w kilku książkach jest otwarcie powiedziane), że zerowa kurtoza oznacza normalność. Istnieją rozkłady z nadmiarem kurtozy 0, które nie są niczym normalnym. Oto przykład:
Rzeczywiście, to także ilustruje poprzedni punkt. Mógłbym z łatwością skonstruować podobny wygląd z wyższą kurtozą niż normalnie, ale który wciąż jest zero w środku - całkowity brak piku.
Na stronie znajduje się wiele postów opisujących kurtozę. Jeden przykład jest tutaj .
źródło
Edytuj 23.11.2018: Od czasu napisania tego posta opracowałem pewne geometryczne perspektywy dotyczące kurtozy. Jednym z nich jest to, że nadmiar kurtozy można rzeczywiście wizualizować geometrycznie w kategoriach odchyleń od oczekiwanej linii 45 stopni w ogonach normalnego wykresu kwantowo-kwantylowego; patrz Czy ten wykres QQ wskazuje na rozkład leptokurtyczny czy platykurtyczny?
źródło
Inny rodzaj odpowiedzi: możemy zilustrować geometrycznie kurtozę, używając pomysłów z http://www.quantdec.com/envstats/notes/class_06/properties.htm : momenty graficzne.
Poniżej pokażę wykres kurtozy graficznej dla niektórych rozkładów symetrycznych, wszystkie wyśrodkowane na zero i skalowane do wariancji 1.
Zwróć uwagę na faktyczny brak wkładu do kurtozy z centrum, co pokazuje, że kurtoza nie ma wiele wspólnego z „szczytowością”.
źródło