W jaki sposób kurtoza rozkładu jest związana z geometrią funkcji gęstości?

12

Kurtoza ma mierzyć szczytowość i płaskość rozkładu. Funkcja gęstości rozkładu, jeśli istnieje, może być postrzegana jako krzywa i ma cechy geometryczne (takie jak krzywizna, wypukłość, ...) związane z jej kształtem.

Zastanawiam się więc, czy kurtoza rozkładu jest związana z niektórymi cechami geometrycznymi funkcji gęstości, które mogą wyjaśnić geometryczne znaczenie kurtozy?

Tim
źródło
Proszę o pewien związek we wzorze do pewnej geometrycznej wielkości krzywej gęstości, a nie tylko niejasne znaczenie, które wskazałem w moim poście. Albo dobrze jest wyjaśnić, dlaczego kurtoza ma znaczenie geometryczne
Tim
@Peter To dalekie od prawdy. Można modyfikować geometrię wykresu PDF prawie dowolnie, bez zmiany określonych (skończonych jego) momentów.
whuber
Blisko powiązane pytanie na stats.stackexchange.com/questions/25010/... sugeruje, jaka powinna być właściwa odpowiedź na to pytanie.
whuber
@ Whuber, chociaż się zgadzam i dziękuję za ten przykład, zastanawiam się również, czy nie mówi on więcej o niezwykłej właściwości tej konkretnej rodziny pdf niż o kurtozie w ogóle.
user603
@ user603 Dobrze się zastanawiać. Jednak stwierdzenie nie dotyczy tej konkretnej rodziny: po prostu zdarza się, że dla logarytmicznej dystrybucji można stworzyć wyraźną reprezentację klasy alternatywnych plików PDF z tymi samymi momentami. Wyjątkowe jest to, że wszystkie momenty są takie same, ale zaburzanie większości rozkładów w sposób, który ustala określoną liczbę ich momentów, nie jest trudne. (Jest to trudne w przypadku niektórych dyskretnych dystrybucji, takich jak Bernoulli, ale nie mają plików PDF.)
whuber

Odpowiedzi:

17

Chwile ciągłego rozkładu i ich funkcje, takie jak kurtoza, mówią bardzo niewiele o wykresie jego funkcji gęstości.

Rozważmy na przykład następujące wykresy.

wprowadź opis zdjęcia tutaj

Każdy z nich jest wykresem funkcji nieujemnej integrującej się z : wszystkie są plikami PDF. Co więcej, wszystkie mają dokładnie takie same chwile - każdą ostatnią nieskończoną liczbę. W ten sposób dzielą wspólną kurtozę (która zdarza się równa )- 3 + 3 e 2 + 2 E 3 + e 413+3e2+2e3+e4

Wzory dla tych funkcji to

fk,s(x)=12πxexp(12(log(x))2)(1+ssin(2kπlog(x))

dla i- 1 s 1 , k Z .x>0, 1s1,kZ.

Na rysunku pokazano wartości po lewej stronie i wartości na górze. Lewa kolumna pokazuje plik PDF dla standardowego rozkładu logarytmicznego.ksk

Ćwiczenie 6.21 w Zaawansowanej teorii statystyki Kendalla (Stuart & Ord, wydanie 5) prosi czytelnika, aby pokazał, że wszystkie mają te same chwile.

Podobnie można zmodyfikować dowolny plik pdf, aby utworzyć inny plik PDF o radykalnie innym kształcie, ale z tymi samymi drugimi i czwartymi momentami centralnymi (powiedzmy), które zatem miałyby tę samą kurtozę. Tylko z tego przykładu powinno być całkowicie jasne, że kurtoza nie jest łatwą do interpretacji lub intuicyjną miarą symetrii, jednomodalności, bimodalności, wypukłości lub jakiejkolwiek innej znanej geometrycznej charakterystyki krzywej.

Dlatego też funkcje momentów (i kurtoza jako szczególny przypadek) nie opisują właściwości geometrycznych wykresu pdf. To intuicyjnie ma sens: ponieważ pdf reprezentuje prawdopodobieństwo za pomocą obszaru, możemy prawie dowolnie przesuwać gęstość prawdopodobieństwa z jednej lokalizacji do drugiej, radykalnie zmieniając wygląd pdf, jednocześnie ustalając dowolną skończoną liczbę z góry określonych momentów.

Whuber
źródło
1
„Tylko z tego przykładu powinno być całkowicie jasne ... każda inna znana geometryczna charakterystyka krzywej.” Rozumiem, co masz na myśli, ale tutaj jest uzasadniona rozbieżność. Inna interpretacja to Darlington, który pokazuje, jak wychodząc z rozkładu symetrycznego, przesunięcie pewnej masy w określonych punktach zwiększa / zmniejsza kurtozę (znowu, nie jest to sprzeczność z twoim przykładem, tylko bardziej „pozytywne” zrozumienie).
user603
1
@ user603 Nie zgadzam się, ale myślę, że „pozytywne” podejście pomija bardzo szczególne założenia, które są domyślnie przyjmowane, aby w ogóle działały. Można również zacząć od wykresu niezwykle asymetrycznego pliku PDF, którego skośność wynosi zero (nie jest trudny do skonstruowania). Tak więc pozytywne podejście opisuje jedynie to, co dzieje się z niektórymi bardzo specjalnymi plikami PDF, gdy masa jest przenoszona. Chociaż może to być dość przydatne dla intuicji, wydaje się, że nie ma logicznego związku z obecnym pytaniem.
whuber
1
Zgadzam się ze skośnością (i ogólną odpowiedzią). Ale kurtoza jako funkcja ma minimum. To sprawia, że ​​rzeczy są nieco bardziej interesujące.
user603
1
@ user603 Dziękujemy; to wnikliwe rozróżnienie. Nie sądzę, żeby zmieniał którykolwiek z obecnych wniosków w istotny sposób, ale z pewnością pomaga intuicji i wskazuje na ważną różnicę między parzystymi i nieparzystymi momentami.
whuber
6

W przypadku rozkładów symetrycznych (dla których znaczące są nawet momenty wyśrodkowane) kurtoza mierzy geometryczną cechę leżącego u podstaw pliku pdf. Nie jest prawdą, że kurtoza mierzy (lub ogólnie jest związana) z pikiem rozkładu. Zamiast tego kurtoza mierzy, jak daleko rozkład leżący u podstaw jest symetryczny i bimodalny (algebraicznie, idealnie symetryczny i bimodalny rozkład będzie miał kurtozę 1, co jest najmniejszą możliwą wartością, jaką może mieć kurtoza) [0].

W skrócie [1], jeśli zdefiniujesz:

k=E(xμ)4/σ4

z , a następnieE(X)=μ,V(X)=σ2

k=V(Z2)+11

dla .Z=(Xμ)/σ

To implikuje, że można postrzegać jako miarę dyspersji wokół jego oczekiwań 1. Innymi słowy, jeśli masz geometryczną interpretację wariancji i oczekiwań, to wynika z kurtozy.Z 2kZ2

[0] RB Darlington (1970). Czy Kurtosis jest naprawdę „szczytem”? The American Statistician, t. 24, nr 2.

[1] JJA Moors (1986). The Meaning of Kurtosis: Darlington Reexamined. The American Statistician, tom 40, wydanie 4.

użytkownik603
źródło
1
Gdziekolwiek piszesz „bimodalny”, czy może masz na myśli „unimodalny”?
whuber
1
Tak, te przykłady działają dla rozkładów symetrycznych. Z rodzin pseudo-lognormalnych można skonstruować jednoznacznie: weź jeden z tych (nieskończenie modalnych) plików pdf za pomocą i zdefiniuj nowy plik pdf jakoMieszając niewielką ilość rozkładem minimalnej kurtozy, okazuje się, że istnieją rozkłady o nieskończenie wielu trybach, których kurtoza jest arbitralnie bliska minimalnej wartości . Tak więc przynajmniej kurtoza nic nie mówi o bimodalności. Skoro tak nie jest, to jaką dokładnie geometryczną właściwość pdf opisuje? μ g ( x ) = ( f ( x ) + f ( 2 μ - x ) ) / 2. g 1fμg(x)=(f(x)+f(2μx))/2.g1
whuber
1
Kurtosis nie wskazuje na bimodalność, z wyjątkiem skrajnego przypadku, gdy jest bliski minimum, w którym wskazuje coś podobnego do dwupunktowego rozkładu możliwego do uzyskania. Możesz mieć rozkłady bimodalne z każdą możliwą wartością kurtozy. Zobacz ncbi.nlm.nih.gov/pmc/articles/PMC4321753 przykłady.
Peter Westfall
1
Tak; zobacz artykuł, który połączyłem. Pierwsze zdanie streszczenia DeCarlo jest całkowicie błędne. Jeśli nie chcesz czytać mojego artykułu, oto matematyka: weź dowolny symetryczny rozkład bimodalny i zmieszaj go z dużo szerszym rozkładem symetrycznym mającym tę samą medianę co bimodal. Mieszanina jest symetryczna i bimodalna dla małych . Poprawiając szerszy rozkład i mieszanie p , możesz ustawić zasięg kurtozy do nieskończoności. I możesz uzyskać kurtozę tak małą, jak chcesz, używając .5N (-1, v) + .5N (1, v), pozwalając . Symetryczne i bimodalne pliki PDF są łatwe do zbudowania dla wszystkich kurtoz. ppv0
Peter Westfall
5

[Uwaga: zostało to napisane w odpowiedzi na inne pytanie na stronie; odpowiedzi zostały połączone z obecnym pytaniem. Właśnie dlatego ta odpowiedź wydaje się odpowiadać na pytanie o innym brzmieniu. Jednak znaczna część postu powinna być tutaj istotna.]

Kurtosis tak naprawdę nie mierzy kształtu dystrybucji. Być może w niektórych rodzinach dystrybucji można opisać kształt, ale bardziej ogólnie kurtoza nie mówi zbyt wiele o rzeczywistym kształcie. Na kształt ma wpływ wiele rzeczy, w tym niezwiązanych z kurtozą.

Jeśli ktoś szuka obrazów kurtozy, pojawia się całkiem sporo takich zdjęć:

p

które zamiast tego wydają się wykazywać zmienną wariancję, a nie wzrost kurtozy. Dla porównania oto trzy normalne gęstości, które właśnie narysowałem (używając R) z różnymi odchyleniami standardowymi:

wprowadź opis zdjęcia tutaj

Jak widać, wygląda prawie identycznie jak poprzednie zdjęcie. Wszystkie mają dokładnie taką samą kurtozę. Dla porównania, oto przykład, który prawdopodobnie jest bliższy temu, do czego dążył diagram

wprowadź opis zdjęcia tutaj

6

To zwykle mają na myśli ludzie, gdy mówią o kurtozie wskazującej kształt gęstości. Kurtoza może być jednak subtelna - nie musi tak działać.

Na przykład przy danej wariancji wyższa kurtoza może faktycznie występować z niższym pikiem.

Trzeba też wystrzegać się pokusy (i w kilku książkach jest otwarcie powiedziane), że zerowa kurtoza oznacza normalność. Istnieją rozkłady z nadmiarem kurtozy 0, które nie są niczym normalnym. Oto przykład:

dgam 2.3

Rzeczywiście, to także ilustruje poprzedni punkt. Mógłbym z łatwością skonstruować podobny wygląd z wyższą kurtozą niż normalnie, ale który wciąż jest zero w środku - całkowity brak piku.

Na stronie znajduje się wiele postów opisujących kurtozę. Jeden przykład jest tutaj .

Glen_b - Przywróć Monikę
źródło
Ale nie powiedziałem tego? Książka tak mówi?
Stat Tistician
Wiem to. Nigdy nie powiedziałem, że to powiedziałeś. Jak sugerowałbyś, żebym odpowiedział na rażąco niepoprawne stwierdzenia, o które pytasz? Udawać, że się nie mylą?
Glen_b
1
@Glen_b Zdjęcia nie pochodzą z książki. Książka nie zawiera ilustracji. Użyłem wyszukiwania obrazów Goolge dla tych ilustracji.
Stat Tistician
2
Niektórzy autorzy piszą o kurtozie jako szczytowości, a niektórzy piszą o jej ciężarze ogona, ale sceptyczna interpretacja, że ​​kurtoza jest tym, co mierzy kurtoza, jest jedyną całkowicie bezpieczną historią. Liczbowe przykłady podane przez samego Irvinga Kaplanskiego (1945) wystarczają, aby wykazać, że kurtoza nie ma jednoznacznej interpretacji. (Artykuł Kaplansky'ego jest jednym z niewielu, które napisał w połowie lat 40. XX wieku na temat prawdopodobieństwa i statystyki. Jest on bardziej znany jako wybitny algebraista.) Pełna literatura i więcej w stata-journal.com/sjpdf.html?articlenum=st0204
Nick Cox,
1
Istnieją książki i artykuły, w których twierdzi się, że kurtoza jest szczytem, ​​więc moja pierwsza klauzula pozostaje poprawna, a także możliwa do poparcia jako stwierdzenie o tym, co znajduje się w literaturze. Najważniejsze jest to, jak postrzegamy przykłady i argumenty Kaplanskyego.
Nick Cox,
3

μ±σ

Edytuj 23.11.2018: Od czasu napisania tego posta opracowałem pewne geometryczne perspektywy dotyczące kurtozy. Jednym z nich jest to, że nadmiar kurtozy można rzeczywiście wizualizować geometrycznie w kategoriach odchyleń od oczekiwanej linii 45 stopni w ogonach normalnego wykresu kwantowo-kwantylowego; patrz Czy ten wykres QQ wskazuje na rozkład leptokurtyczny czy platykurtyczny?

pV(v)V={(Xμ)/σ}4Xmi(V.)V.X

μ±σXμ±σμσX0,25μ±σμσ

Peter Westfall
źródło
3
Czy mógłbyś streścić tutaj argumenty zamiast po prostu kontynuować odsyłanie ludzi do artykułu na większości swoich postów? Zobacz pomoc tutaj pod hasłem „Zawsze udostępniaj kontekst linków”, w szczególności tam, gdzie jest napisane „zawsze cytuj ważną część”. Niekoniecznie trzeba go dosłownie cytować tam, gdzie argument jest obszerny, ale potrzebne jest przynajmniej streszczenie argumentu. Po prostu zrób kilka ogólnych oświadczeń, a następnie umieść link do artykułu. Stwierdzenie, że kurtoza mierzy zachowanie ogona, jest (nieobecne w kontekście) wprowadzające w błąd (co wyraźnie pokazuje)
Glen_b -Reinstate Monica
2
... ale nie można nie zgodzić się z argumentami, których tu nie prezentujesz, i być może dojść do bardziej dopracowanych wniosków.
Glen_b
Moje argumenty są tu jasno przedstawione: en.wikipedia.org/wiki/… Komentarze mile widziane! BTW, kurtoza JEST miarą masy ogona, po prostu nie taką samą jak inne, które zostały wzięte pod uwagę. Mierzy ciężar ogona za pomocą E (Z ^ 4), który jest miarą wagi ogona, ponieważ wartości | Z | <1 wnoszą tak niewielki wkład. Według tej samej logiki, E (Z ^ n), dla wyższych parzystych mocy n, są również miarami wagi ogona.
Peter Westfall
Cześć Peter, odwiedź stats.stackexchange.com/help/merging-accounts, aby połączyć swoje konta i zmodyfikować swoje stare posty.
whuber
3

Inny rodzaj odpowiedzi: możemy zilustrować geometrycznie kurtozę, używając pomysłów z http://www.quantdec.com/envstats/notes/class_06/properties.htm : momenty graficzne.

k=mi(X-μσ)4=(x-μσ)4fa(x)rex
faXμ,σ2)x kmi=k-3)

Poniżej pokażę wykres kurtozy graficznej dla niektórych rozkładów symetrycznych, wszystkie wyśrodkowane na zero i skalowane do wariancji 1.

wizualyczna kurtoza dla niektórych rozkładów symetrycznych

Zwróć uwagę na faktyczny brak wkładu do kurtozy z centrum, co pokazuje, że kurtoza nie ma wiele wspólnego z „szczytowością”.

kjetil b halvorsen
źródło
1
Z2)-b+bb