rozkład t mający cięższy ogon niż rozkład normalny

10

W notatkach z mojego wykładu jest napisane:

rozkład t wygląda normalnie, choć z nieco cięższymi ogonami.

Rozumiem, dlaczego wyglądałoby to normalnie (z powodu twierdzenia o granicy centralnej). Ale trudno mi zrozumieć, jak matematycznie udowodnić, że ma on cięższe ogony niż rozkład normalny i czy istnieje sposób na zmierzenie, w jakim stopniu jest cięższy niż rozkład normalny.

hmi2015
źródło

Odpowiedzi:

12

Pierwszą rzeczą do zrobienia jest sformalizowanie tego, co rozumiemy przez „cięższy ogon”. Po standaryzacji obu rozkładów, aby mieć tę samą lokalizację i skalę (np. Odchylenie standardowe), można po prostu spojrzeć na to, jak wysoka jest gęstość w skrajnym ogonie:

wprowadź opis zdjęcia tutaj
(z tej odpowiedzi, która jest również w pewnym stopniu istotna dla twojego pytania )

[W tym przypadku skalowanie nie ma tak naprawdę znaczenia; t będzie nadal „cięższy” niż normalnie, nawet jeśli użyjesz bardzo różnych skal; normalność zawsze ostatecznie obniża się]

Jednak ta definicja - choć działa dobrze w przypadku tego konkretnego porównania - nie uogólnia się zbyt dobrze.

Mówiąc bardziej ogólnie, o wiele lepsza definicja znajduje się w odpowiedzi Whubera . Więc jeśliY jest cięższy niż X, tak jak t staje się wystarczająco duży (dla wszystkich t> trochę t0), następnie SY(t)>SX(t), gdzie S=1F, gdzie F to cdf (dla grubszych po prawej stronie; z drugiej strony jest podobna, oczywista definicja).

wprowadź opis zdjęcia tutaj

Tutaj jest w skali logarytmicznej i w skali kwantowej normy, co pozwala nam zobaczyć więcej szczegółów:

wprowadź opis zdjęcia tutaj

Zatem „dowód” na większą ogonowość wymagałby porównania cdfs i pokazania, że ​​górny ogon t-cdf ostatecznie zawsze znajduje się powyżej tego normalnego, a dolny ogon t-cdf ostatecznie zawsze znajduje się poniżej tego normalnego.

W takim przypadku łatwą rzeczą jest porównanie gęstości, a następnie wykazanie, że odpowiednie względne położenie cdfs (/ funkcji survivor) musi wynikać z tego.

Na przykład, jeśli możesz się z tym kłócić (w pewnym momencie ν)

x2(ν+1)log(1+x2ν)>2log(k)

dla niezbędnej stałej k (funkcja ν), dla wszystkich x> trochę x0, to byłoby możliwe ustalenie cięższego ogona tν także na definicji w kategoriach większych 1F (lub większy F na lewym ogonie).

(ta forma wynika z różnicy dziennika gęstości, jeśli zachowuje niezbędny związek między gęstościami)

[Właściwie można to pokazać dla każdego k (nie tylko ten, którego potrzebujemy, pochodzący z odpowiednich stałych normalizujących gęstość), więc wynik musi się przydać k potrzebujemy.]

Glen_b - Przywróć Monikę
źródło
1
Wykres z logS(x) (i być może przedłużanie xtrochę) może wyraźniej pokazać cięższe ogony, a także może pracować z wyższymi stopniami swobody,
Henry
1
@Henry Wygrałem taki spisek, ale nie byłem pewien, ile to dodał, więc go nie uwzględniłem. Zastanowię się nad tym.
Glen_b
1
@Henry załączyłem fabułę.
Glen_b
2

Jednym ze sposobów dostrzeżenia różnicy jest wykorzystanie chwil E{xn}.

„Cięższe” ogony będą oznaczać wyższe wartości dla parzystych momentów mocy (moc 4, 6, 8), gdy wariancja jest taka sama. W szczególności moment czwartego rzędu (około zera) nazywa się kurtozą i w pewnym sensie porównuje ciężkość ogonów.

Szczegóły w Wikipedii ( https://en.wikipedia.org/wiki/Kurtosis )

Dacian Bonta
źródło
1
Chociaż dla t-dystrybucja z 3 lub 4 stopnie swobody kurtoza jest nieskończona, podczas gdy z 2 stopnie swobody odchylenie standardowe jest nieskończone, więc nie można obliczyć kurtozy i przy pomocy 1 stopnia swobody nie można nawet obliczyć średniej ani wartości 4ten moment.
Henry,
3
@Henry Niemniej jednak ten pomysł jest dobry. Rozszerzanie CDF Studentat(ν) dystrybucja wokół + pokazuje, że jest asymptotycznie proporcjonalny do xν. Zatem wszystkie bezwzględne momenty o wadze mniejszej niżν istnieją i wszystkie bezwzględne momenty masy są większe niż νodchodzić. Przy rozkładzie normalnym istnieją wszystkie momenty absolutne. Zapewnia to określone uporządkowanie ogonów wszystkich Studentówtrozkłady i rozkład normalny. W efekcie parametrνzawiera jedną odpowiedź na pierwotne pytanie dotyczące sposobu pomiaru ciężkości ogona.
whuber
2

Oto formalny dowód oparty na funkcjach przetrwania. Używam następującej definicji „cięższego ogona” inspirowanej wikipedią :

Zmienna losowa Y z funkcją przetrwania Sy(t) ma cięższe ogony niż zmienna losowa X z funkcją przetrwania Sx(t) iff

limtSy(t)Sx(t)=

Rozważ zmienną losową Y rozłożone jako t Studenta ze średnią zero, stopniami swobody ν i parametr skali a. Porównujemy to do zmiennej losowejXN(0,σ2). Dla obu zmiennych funkcje przeżycia są rozróżnialne. W związku z tym,

limtSy(t)Sx(t)=limtfy(t)fx(t)=explimt(logfy(t)logfx(t))=explimt(ν+12log(1+t2νa2)(12σ2t2)+C)=exp(limtν+12log(1+t2νa2)(12σ2t2)+C)=exp(limt12σ2t2ν+12log(1+t2νa2)+C)=exp(12limua2σ2u(ν+1)log(1+uν)+C)=exp(12limuu(a2σ2(ν+1)log(1+uν)u+Cu))
Gdzie zastąpiliśmy u=t2/a2. Zauważ, że0<a2/σ2< jest stałą limuC/u=0 i
limu(ν+1)log(1+uν)u=limu(ν+1)(1)(1+uν)(ν)=0
Stąd przez twierdzenie o granicy algebraicznej,
limtSy(t)Sx(t)=exp(12limuu(a2σ2(0)+(0)))=

Co ważne, wynik dotyczy dowolnych (skończonych) wartości a, σ2, i ν, więc możesz mieć sytuacje, w których rozkład ma mniejszą wariancję niż normalnie, ale nadal ma cięższe ogony.

Will Townes
źródło
1
Tylko uwaga, że ​​ta „definicja” cięższych ogonów nie zawsze jest akceptowalna. Na przykład rozkład N (0,1), według tej definicji, ma cięższe ogony niż rozkład .9999 * U (-1,1) + .0001 * U (-1000, 1000), mimo że ten ostatni rozkład daje sporadyczne wartości do 175 odchyleń standardowych od średniej, pomimo ograniczonego wsparcia. Oczywiście N (0,1) również wytwarza takie wartości, ale z prawdopodobieństwami znacznie poniżej tego, co można uznać za istotne dla celów praktycznych.
Peter Westfall,