Czym dokładnie są chwile? Jak powstają?

19

Zazwyczaj wprowadzamy się do metody estymatorów momentów poprzez „zrównanie momentów populacyjnych z ich odpowiednikiem próbki”, dopóki nie oszacujemy wszystkich parametrów populacji; tak, że w przypadku rozkładu normalnego potrzebowalibyśmy tylko pierwszego i drugiego momentu, ponieważ w pełni opisują ten rozkład.

E(X)=μi=1nXi/n=X¯

E(X2)=μ2+σ2i=1nXi2/n

I teoretycznie moglibyśmy obliczyć do n dodatkowych momentów jako:

E(Xr)i=1nXir/n

Jak zbudować intuicję na to, jakie naprawdę są chwile? Wiem, że istnieją one jako pojęcie w fizyce i matematyce, ale nie uważam, aby można je było zastosować bezpośrednio, szczególnie dlatego, że nie wiem, jak dokonać abstrakcji od koncepcji masy do punktu danych. Termin wydaje się być używany w określony sposób w statystyce, co różni się od użycia w innych dyscyplinach.

Jaka cecha moich danych decyduje o tym, ile ( r ) momentów jest ogólnie?

Constantin
źródło
7
Termin ten oznacza to samo, co robi w fizyce, w odniesieniu do rozkładu prawdopodobieństwa. Zobacz tutaj , który ma równanie , „gdzie ρ jest rozkładem gęstości ładunku, masy lub dowolnej innej rozważanej wielkości”. Kiedy „rozpatrywaną rzeczą” jest gęstość prawdopodobieństwa, masz odpowiedni moment prawdopodobieństwa. To są surowe chwile (chwile o pochodzeniu). Dla porównania ... (ctd)μn=rnρ(r)drρ
Glen_b
2
Momenty to sparametryzowane cechy rozkładu zmiennych losowych, takich jak kwantyle. Momenty są parametryzowane liczbami naturalnymi i całkowicie charakteryzują rozkład (patrz funkcja generowania momentu ). Nie wyklucza to, że dla niektórych rozkładów może istnieć idealna zależność funkcjonalna między momentami, więc nie wszystkie momenty są zawsze wymagane do scharakteryzowania rozkładu. (1/2)
tchakravarty
Momenty są funkcjonalnie zależne od pierwszych dwóch dla rozkładu normalnego, więc pierwsze dwa wystarczą do scharakteryzowania rozkładu, w tym średniej i wariancji. (2/2)3
tchakravarty
5
(ctd) ... momenty w matematyce są takie same ( ), z wyjątkiem około c zamiast 0 (tj. po prostu uogólniona postać fizyki - ale ponieważ są one takie same z samą zmianą pochodzenia, fizyk słusznie powiedziałby „czym to się różni?”). Są one takiesamejak w przypadku prawdopodobieństwa, gdy f jest gęstością. Dla mnie wszyscy trzej mówią o tym samym, kiedy mówią „chwile”, a nie różne rzeczy. μn=(xc)nf(x)dxcf
Glen_b
3
Jestem pewien, że znajdziesz odpowiedzi w wielu wątkach na temat chwil i intuicji . Statystyki wykorzystują momenty dokładnie w taki sam sposób, jak w fizyce i matematyce - jest to ta sama koncepcja z taką samą definicją we wszystkich trzech dziedzinach.
whuber

Odpowiedzi:

17

Minęło dużo czasu, odkąd wziąłem lekcje fizyki, więc daj mi znać, jeśli coś z tego jest nieprawidłowe.

Ogólny opis momentów z fizycznymi analogami

Weź zmienną losową, . N -tego moment X wokół c oznacza: m n ( C ) = E [ ( x - c ) n ] Odpowiada to dokładnie w sensie fizycznym o momencie. Wyobraź sobie X jako zbiór punktów wzdłuż rzeczywistej linii o gęstości podanej w pliku pdf. Umieść punkt podparcia pod tą linią w punkcie c i rozpocznij obliczanie momentów w stosunku do tego punktu, a obliczenia będą dokładnie odpowiadały momentom statystycznym.XnXc

mn(c)=E[(Xc)n]
Xc

Większość czasu, -tego moment X odnosi się do momentu około 0 (momentów, w których punktem podparcia jest umieszczona na 0) m, n = E [ X n ] n -tego centralnego momentu X wynosi: m n = m n ( m 1 ) = E [ ( X - m 1 ) n ]nX

mn=E[Xn]
nX
m^n=mn(m1)=E[(Xm1)n]
Odpowiada to momentom, w których punkt podparcia jest umieszczony w środku masy, więc rozkład jest zrównoważony. Pozwala to łatwiej interpretować chwile, jak zobaczymy poniżej. Pierwszy centralny moment będzie zawsze wynosił zero, ponieważ rozkład jest zrównoważony.

-ty znormalizowany moment X wynosi: ~ m n = m nnX

m~n=m^n(m^2)n=E[(Xm1)n](E[(Xm1)2])n
ponownie, to wagi chwile przez rozprzestrzenianie rozkładu, co ułatwia interpretację konkretnie Kurtoza. Pierwszy znormalizowany moment będzie zawsze wynosił zero, drugi zawsze będzie jeden. Odpowiada to momentowi standardowego wyniku (z-score) zmiennej. Nie mam świetnego fizycznego analogu do tej koncepcji.

Często używane chwile

Dla każdej dystrybucji istnieje potencjalnie nieskończona liczba momentów. Wystarczająco dużo momentów prawie zawsze w pełni scharakteryzuje i rozprowadzi (ustalenie niezbędnych warunków, aby być pewnym, jest częścią problemu chwili ). W statystykach często mówi się o czterech chwilach:

  1. Oznacza - pierwszy moment (wyśrodkowany wokół zera). Jest to środek masy rozkładu lub alternatywnie jest on proporcjonalny do momentu momentu obrotowego rozkładu względem punktu podparcia w punkcie 0.
  2. X
  3. Skośność - trzeci centralny moment (czasem znormalizowany). Miara skosu rozkładu w tym lub innym kierunku. W stosunku do rozkładu normalnego (który nie ma skosu), rozkład dodatnio skośny ma niskie prawdopodobieństwo ekstremalnie wysokich wyników, rozkłady ujemnie skośne mają małe prawdopodobieństwo ekstremalnie niskich wyników. Fizyczne analogi są trudne, ale luźno mierzy asymetrię rozkładu. Przykładowo poniższy rysunek pochodzi z Wikipedii . Skośność, zaczerpnięte z Wikipedii
  4. XKurtosis, również z WIkipedii

Rzadko rozmawiamy o chwilach poza Kurtosis, właśnie dlatego, że jest w nich bardzo mało intuicji. Jest to podobne do zatrzymania fizyków po drugiej chwili.

jayk
źródło
6

To trochę stary wątek, ale chcę poprawić zniekształcenie w komentarzu Fg Nu, który napisał: „Momenty są parametryzowane przez liczby naturalne i całkowicie charakteryzują rozkład”.

Momenty NIE w pełni charakteryzują rozkład. W szczególności znajomość wszystkich nieskończonej liczby chwil, nawet jeśli one istnieją, niekoniecznie jednoznacznie określa rozkład.

Według mojej ulubionej książki o prawdopodobieństwie, Fellera „Wprowadzenie do teorii prawdopodobieństwa i jej zastosowania, tom II” (patrz moja odpowiedź w rzeczywistych przykładach wspólnych rozkładów ), sekcja VII.3, przykład na str. 227–228, Lognormal nie jest określony według jego momentów, co oznacza, że ​​istnieją inne rozkłady mające całą nieskończoną liczbę momentów taką samą jak Lognormal, ale różne funkcje dystrybucji. Jak powszechnie wiadomo, funkcja generowania momentu nie istnieje dla Lognormal, ani nie może być dla innych rozkładów posiadających te same momenty.

X

n=1(mi[X2)n])-1/(2)n)

rozbieżne. Pamiętaj, że nie jest to tylko wtedy, gdy. Ten warunek nie odnosi się do Lognormal i faktycznie nie jest determinowany przez jego chwile.

Z drugiej strony rozkłady (zmienne losowe), które dzielą całą nieskończoną liczbę momentów, mogą się różnić tylko tak bardzo, z powodu nierówności, które można wyprowadzić z ich momentów.

Mark L. Stone
źródło
Jest to znacznie uproszczone, gdy rozkład jest ograniczony, w którym to przypadku momenty zawsze określają rozkład całkowicie (unikatowo).
Alex R.
@Alex Jest to bezpośrednia konsekwencja wyniku cytowanego w Feller.
whuber
Nie jest całkowicie poprawne stwierdzenie, że funkcja generowania momentu nie istnieje dla lognormal. Najbardziej przydatne twierdzenia o mgf zakładają, że istnieje on w otwartym przedziale zawierającym zero, iw ścisłym tego słowa znaczeniu nie istnieje. Ale istnieje w promieniu emanującym od zera !, który także dostarcza użytecznych informacji.
kjetil b halvorsen
@ kjetil b halvorsen, czy możesz opisać (niektóre) przydatne informacje, które uzyskałbyś z istnienia MGF logarytmu normalnego na promieniu emanującym od zera? Co by to był za promień?
Mark L. Stone,
Guzik powyższego komentarza jako pytanie do @kjetil b halvorsen ..
Mark L. Stone
2

Następstwem uwag Glen_b jest to, że pierwszy moment, środek, odpowiada środkowi ciężkości obiektu fizycznego, a drugi moment wokół środka, wariancja, odpowiada momentowi bezwładności. Potem jesteś sam.

Mike Anderson
źródło
3
Podoba mi się relacja pierwszej chwili i średniej ... ale druga chwila nie jest wariancją ... wariancja jest środkową drugą chwilą ...mi[x2)]=x2)fa(x)rex vzar[x]=mi[(x-mi[x])2)]=(x-mi[x])2)fa(x)rex.
Zachary Blumenfeld,
0

Drzewo dwumianowe ma dwie gałęzie, z których każda ma prawdopodobnie 0,5. W rzeczywistości p = 0,5, a q = 1-0,5 = 0,5. Generuje to rozkład normalny z równomiernie rozłożoną masą prawdopodobieństwa.

W rzeczywistości musimy założyć, że każda warstwa w drzewie jest kompletna. Kiedy dzielimy dane na pojemniki, otrzymujemy rzeczywistą liczbę z podziału, ale zaokrąglamy w górę. Cóż, ten poziom jest niekompletny, więc nie otrzymujemy histogramu zbliżającego się do normy.

Zmień prawdopodobieństwo rozgałęzienia na p = 0,9999 i q = 0,0001, a to sprawi, że wypaczimy normalne. Przesunięta masa prawdopodobieństwa. To wyjaśnia skośność.

Niepełne poziomy lub kosze mniejsze niż 2 ^ n generują drzewa dwumianowe o obszarach, które nie mają masy prawdopodobieństwa. To daje nam kurtozę.


Odpowiedź na komentarz:

Kiedy mówiłem o określeniu liczby przedziałów, zaokrąglij w górę do następnej liczby całkowitej.

Maszyny Quincunx upuszczają piłki, które ostatecznie przybliżają normalny rozkład przez dwumian. Taka maszyna przyjmuje kilka założeń: 1) liczba przedziałów jest skończona, 2) podstawowe drzewo jest binarne, i 3) prawdopodobieństwa są ustalone. Maszyna Quincunx w Museum of Mathematics w Nowym Jorku pozwala użytkownikowi dynamicznie zmieniać prawdopodobieństwa. Prawdopodobieństwa mogą ulec zmianie w dowolnym momencie, nawet przed ukończeniem bieżącej warstwy. Stąd pomysł, że pojemniki nie są wypełnione.

W przeciwieństwie do tego, co powiedziałem w mojej oryginalnej odpowiedzi, gdy masz pustkę na drzewie, rozkład pokazuje kurtozę.

Patrzę na to z perspektywy systemów generatywnych. Używam trójkąta do podsumowywania drzew decyzyjnych. Gdy podejmowana jest nowatorska decyzja, dodaje się więcej pojemników u podstawy trójkąta i pod względem rozkładu w ogonach. Przycinanie poddrzewa z drzewa pozostawiłoby puste przestrzenie w masie prawdopodobieństwa rozkładu.

Odpowiedziałem tylko, aby dać ci intuicyjny sens. Etykiety? Korzystałem z programu Excel i grałem z prawdopodobieństwami w dwumianach i wygenerowałem oczekiwane skośności. Nie zrobiłem tego z kurtozą, nie pomaga to, że jesteśmy zmuszeni myśleć o masie prawdopodobieństwa jako statycznej podczas używania języka sugerującego ruch. Podstawowe dane lub kulki powodują kurtozę. Następnie analizujemy to na różne sposoby i przypisujemy do kształtowania opisowych terminów, takich jak środek, ramię i ogon. Jedyne, z czym musimy pracować, to pojemniki. Pojemniki żyją dynamicznym życiem, nawet jeśli dane nie mogą.

David Locke
źródło
2
To intrygujące, ale strasznie szkicowe. Jakie są na przykład etykiety na drzewie dwumianowym? Lepiej być drzewem nieskończonym, jeśli chcesz uzyskać rozkład normalny - ale wtedy oczywiste etykiety (przy użyciu losowego przejścia lub binarnych reprezentacji liczb rzeczywistych) wcale nie prowadzą do normalnych rozkładów. Bez tych szczegółów zbyt wiele pozostawia wyobraźni czytelników. Czy mógłbyś je rozwinąć?
whuber