Intuicja na chwilę o środku dystrybucji?

14

Czy ktoś może podać intuicję, dlaczego wyższe momenty rozkładu prawdopodobieństwa , podobnie jak moment trzeci i czwarty, odpowiadają odpowiednio skośności i kurtozie? W szczególności dlaczego odchylenie dotyczące średniej podniesionej do trzeciej lub czwartej potęgi ostatecznie przekłada się na miarę skośności i kurtozy? Czy istnieje sposób na odniesienie tego do trzeciej lub czwartej pochodnej funkcji?pX

Rozważ tę definicję skośności i kurtozy:

Skewness(X)=E[(XμX)3]/σ3,Kurtosis(X)=E[(XμX)4]/σ4.

W tych równaniach podnosimy znormalizowaną wartość do potęgi i przyjmujemy jej wartość oczekiwaną. Nie jest dla mnie jasne, dlaczego podniesienie znormalizowanej zmiennej losowej do potęgi czterech daje „szczytowość” lub dlaczego podniesienie znormalizowanej zmiennej losowej do potęgi trzech powinno dać „skośność”. To wydaje się magiczne i tajemnicze!(Xμ)/σ

użytkownik248237
źródło
4
Moją intuicją na przekrzywieniu jest zauważyć, że trzecia moc zachowuje negatywy. Więc jeśli masz większe ujemne odchylenia od średniej niż pozytywne (mówiąc bardzo prosto), to otrzymujesz ujemny rozkład przekrzywiony. Moją intuicją dla kurtozy jest to, że czwarta moc wzmacnia duże odchylenia od średniej znacznie więcej niż druga moc. Dlatego uważamy kurtozę za miarę tego, jak gruby jest ogon dystrybucji. Zauważ, że bardzo duże możliwości x od średniej mu są podniesione do czwartej mocy, co czyni je wzmacnianymi, ale ignoruje znak.
wolfsatthedoor
1
Ponieważ wartości 4 są znacznie bardziej zależne od wartości odstających niż 1, spodziewam się, że niewiele zyskasz patrząc na czwartą chwilę dotyczącą mediany - przynajmniej jeśli celem była wytrzymałość.
Glen_b
1
Po pierwsze, zauważ, że te wyższe momenty niekoniecznie są dobrymi / niezawodnymi miarami asymetrii / szczytowości. To powiedziawszy, myślę, że wiązki dają dobrą fizyczną intuicję przez pierwsze trzy momenty, np. Średnia = równowaga / skala wiązki , wariancja = wygięcie wspornika , skośność = huśtawka .
GeoMatt22,
1
Masz rację, interpretacja kurtozy jako pomiaru „szczytowości” jest magiczna i tajemnicza. To dlatego, że to wcale nie jest prawda. Kurtosis absolutnie nic nie mówi o szczycie. Mierzy tylko ogony (wartości odstające). Łatwo jest matematycznie udowodnić, że obserwacje w pobliżu szczytu przyczyniają się w niewielkim stopniu do miary kurtozy, niezależnie od tego, czy szczyt jest płaski, kolczasty, bimodalny, sinusoidalny lub w kształcie dzwonu.
Peter Westfall

Odpowiedzi:

8

Istnieje dobry powód dla tych definicji, który staje się jaśniejszy, gdy spojrzysz na ogólną formę momentów znormalizowanych zmiennych losowych. Aby odpowiedzieć na to pytanie, najpierw rozważ ogólną formę n tego znormalizowanego momentu centralnego :

ϕn=E[(XE[X]S[X])n ].

ϕ1=0ϕ2=1n3

ϕn+=E[|XE[X]S[X]|n |X>E[X]]P(X>E[X]),ϕn=E[|XE[X]S[X]|n |X<E[X]]P(X<E[X]).

Są to wielkości nieujemne, które dają tą bezwzględną moc znormalizowanej zmiennej losowej pod warunkiem, że będzie ona wyższa lub niższa od wartości oczekiwanej. Teraz podzielimy znormalizowany moment centralny na te części.n


Dziwne wartości mierzą pochylenie w ogonach:n Dla każdej nieparzystej wartości mamy nieparzystą moc w równaniu momentu i możemy zapisać znormalizowany moment centralny jako . Z tej formy widzimy, że znormalizowany moment centralny daje nam różnicę między tą mocą absolutną znormalizowanej zmiennej losowej, pod warunkiem, że będzie ona odpowiednio powyżej lub poniżej swojej średniej.n3ϕn=ϕn+ϕnn

Zatem dla każdej nieparzystej mocy otrzymamy miarę, która daje wartości dodatnie, jeśli oczekiwana moc bezwzględna znormalizowanej zmiennej losowej jest wyższa dla wartości powyżej średniej niż dla wartości poniżej średniej, i daje wartości ujemne, jeśli oczekiwana moc bezwzględna jest niższa dla wartości powyżej średniej niż dla wartości poniżej średniej. Każdą z tych wielkości można zasadnie uznać za miarę pewnego rodzaju „skośności”, przy czym wyższe moce dają większy względny ciężar wartościom dalekim od średniej.n3

Ponieważ zjawisko to występuje dla każdej nieparzystej mocy , naturalnym wyborem dla archetypowej miary „skośności” jest zdefiniowanie jako skośności. Jest to niższy znormalizowany moment centralny niż wyższe nieparzyste moce i naturalne jest badanie momentów niższego rzędu przed rozważeniem momentów wyższego rzędu. W statystykach przyjęliśmy konwencję określania tego znormalizowanego momentu centralnego jako skośności , ponieważ jest to najniższy znormalizowany moment centralny, który mierzy ten aspekt rozkładu. (Wyższe moce nieparzyste mierzą również typy skośności, ale z coraz większym naciskiem na wartości dalekie od średniej.)n3ϕ3


Parzyste wartości mierzą tłuszcz ogonów:n Dla dowolnej parzystej wartości mamy równą moc w równaniu momentu i możemy zapisać znormalizowany moment centralny jako . Z tej formy widzimy, że znormalizowany moment centralny daje nam sumę tej bezwzględnej mocy znormalizowanej zmiennej losowej, pod warunkiem, że będzie ona odpowiednio powyżej lub poniżej swojej średniej.n3ϕn=ϕn++ϕnn

Zatem dla dowolnej parzystej mocy otrzymamy miarę, która daje wartości nieujemne, z wyższymi wartościami występującymi, jeśli ogony rozkładu znormalizowanej zmiennej losowej są grubsze. Zauważ, że jest to wynik w stosunku do znormalizowanej zmiennej losowej, a zatem zmiana skali (zmiana wariancji) nie ma wpływu na tę miarę. Jest to raczej miara grubości ogonów, po standaryzacji dla wariancji rozkładu. Każdą z tych wielkości można zasadnie uznać za miarę pewnego rodzaju „kurtozy”, przy czym wyższe moce dają większą względną wagę wartościom, które są dalekie od średniej.n3

Ponieważ zjawisko to występuje dla każdej parzystej mocy , naturalnym wyborem dla archetypowej miary kurtozy jest zdefiniowanie jako . Jest to niższy znormalizowany moment centralny niż wyższe parzyste moce i naturalne jest badanie momentów niższego rzędu przed rozważeniem momentów wyższego rzędu. W statystyce przyjęliśmy konwencję określania tego znormalizowanego momentu centralnego jako „kurtozy”, ponieważ jest to najniższy znormalizowany moment centralny, który mierzy ten aspekt rozkładu. (Wyższe parzyste moce również mierzą rodzaje kurtozy, ale z coraz większym naciskiem na wartości dalekie od średniej).n3ϕ 4ϕ4


To równanie jest dobrze zdefiniowane dla każdego rozkładu, którego pierwsze dwa momenty istnieją i który ma niezerową wariancję. Zakładamy, że rozkład odsetek mieści się w tej klasie do końca analizy.

Ben - Przywróć Monikę
źródło
2

Podobne pytanie Co to jest „moment” w „momentach” rozkładu prawdopodobieństwa? Dałem fizyczną odpowiedź na to, co dotyczyło chwil.

„Przyspieszenie kątowe jest pochodną prędkości kątowej, która jest pochodną kąta względem czasu, tj. . Weź pod uwagę, że drugi moment jest analogiczny do momentu obrotowego przyłożonego do ruchu kołowego, lub jeśli będziesz przyspieszania / zwalniania (także drugiej pochodnej) tego ruchu kołowego (tj. kątowego, ). Podobnie, trzeci moment byłby być szybkością zmiany momentu obrotowego, i tak dalej itd. dla jeszcze wyższych momentów, aby uzyskać prędkości zmian szybkości zmian szybkości zmian, tj. sekwencyjne pochodne ruchu kołowego… ”dωdt=α,dθdt=ωθ

Zobacz link, ponieważ być może łatwiej jest to sobie wyobrazić za pomocą fizycznych przykładów.

Skośność jest łatwiejsza do zrozumienia niż kurtoza. Ujemna skośność to cięższy lewy ogon (lub dalsze odchylenie w kierunku ujemnym) niż na prawym, a skośność dodatnia przeciwnie.

Wikipedia cytuje Westfall (2014) i sugeruje, że wysoka kurtoza powstaje albo dla zmiennych losowych, które mają dalekie wartości odstające, albo dla funkcji gęstości z jednym lub dwoma ciężkimi ogonami, jednocześnie twierdząc, że jakakolwiek centralna tendencja danych lub gęstości ma stosunkowo niewielki wpływ na wartość kurtozy. Niskie wartości kurtozy oznaczałyby coś przeciwnego, tj. Brak wartości odstających od osi i względną lekkość obu ogonów.x

Carl
źródło
Skośność jest punktem równowagi pdf , a kurtoza jest punktem równowagi pdf . Obie transformacje „rozciągają” ogony, kurtoza bardziej. Jeśli pdf spadnie po prawej stronie, gdy punkt podparcia jest ustawiony na 0, to w oryginalnym rozkładzie występuje dodatnie pochylenie. Jeśli pdf spada po prawej stronie, gdy punkt podparcia jest ustawiony na 3,0, wówczas pierwotny rozkład jest grubszy niż rozkład normalny. Tutaj „ciężar ogonów” odnosi się bardziej do dźwigni niż do masy. Interpretacja Maurów nie jest w pełni poprawna, ponieważ oba wzmianki o „koncentracji”. Z 4 Z 3 Z 4Z3Z4Z3Z4
Peter Westfall
@PeterWestfall Zgadzam się, że interpretacja Maurów jest niedoskonała. Precyzyjny język nie jest łatwo osiągalny bez dezorientacji. Weźmy na przykład „dźwignię”. Dźwignia finansowa oznacza pierwszą chwilę, a po drugie należałoby wymyślić coś w rodzaju „dźwigni dźwigniowej”, co może dezorientować bardziej niż rozjaśniać. Twoje podejście wydaje się wymyślać nową koncepcję, tj. „Naciągniętą dźwignię”, która wskazuje na transformacje geometryczne, w przypadku których można również twierdzić, że niektórzy zwolennicy uważają ją za samowystarczalną, ryzykującą kontrowersje i niefizyczną dla innych .
Carl
„Dźwignia” odnosi się do pierwszego momentu zmiennej , gdzie . To nie czarna magia. U = Z 4UU=Z4
Peter Westfall
@PeterWestfall Nie bądź zbyt karny, ale wykorzystujesz dźwignię. Jasne, nadal możesz używać tego słowa, a jeśli nie byłby obiektem czwartego wymiaru, w porównaniu z odległością jednowymiarową, , może być nawet przydatne. Kontekstem jest moment i tworzenie fizycznego modelu chwil. Można to zrobić na kilka sposobów, na przykład zobacz moją odpowiedź na ten temat tutaj . Innymi słowy, aby wprowadzić momenty w dowolny kontekst fizyczny, musimy zrobić coś więcej niż machanie ręką i inwokację czwartego wymiaru. ZZ4Z
Carl
@PeterWestfall W kontekście ruchu kołowego nazwalibyśmy moment drugi momentem , a nie dźwignią , która, choć nie jest niepoprawna, nie przywodzi na myśl niczego fizycznego. Z2
Carl