Zazwyczaj wprowadzamy się do metody estymatorów momentów poprzez „zrównanie momentów populacyjnych z ich odpowiednikiem próbki”, dopóki nie oszacujemy wszystkich parametrów populacji; tak, że w przypadku rozkładu normalnego potrzebowalibyśmy tylko pierwszego i drugiego momentu, ponieważ w pełni opisują ten rozkład.
I teoretycznie moglibyśmy obliczyć do dodatkowych momentów jako:
Jak zbudować intuicję na to, jakie naprawdę są chwile? Wiem, że istnieją one jako pojęcie w fizyce i matematyce, ale nie uważam, aby można je było zastosować bezpośrednio, szczególnie dlatego, że nie wiem, jak dokonać abstrakcji od koncepcji masy do punktu danych. Termin wydaje się być używany w określony sposób w statystyce, co różni się od użycia w innych dyscyplinach.
Jaka cecha moich danych decyduje o tym, ile ( ) momentów jest ogólnie?
Odpowiedzi:
Minęło dużo czasu, odkąd wziąłem lekcje fizyki, więc daj mi znać, jeśli coś z tego jest nieprawidłowe.
Ogólny opis momentów z fizycznymi analogami
Weź zmienną losową, . N -tego moment X wokół c oznacza: m n ( C ) = E [ ( x - c ) n ] Odpowiada to dokładnie w sensie fizycznym o momencie. Wyobraź sobie X jako zbiór punktów wzdłuż rzeczywistej linii o gęstości podanej w pliku pdf. Umieść punkt podparcia pod tą linią w punkcie c i rozpocznij obliczanie momentów w stosunku do tego punktu, a obliczenia będą dokładnie odpowiadały momentom statystycznym.X n X c
Większość czasu, -tego moment X odnosi się do momentu około 0 (momentów, w których punktem podparcia jest umieszczona na 0) m, n = E [ X n ] n -tego centralnego momentu X wynosi: m n = m n ( m 1 ) = E [ ( X - m 1 ) n ]n X
-ty znormalizowany moment X wynosi: ~ m n = m nn X
Często używane chwile
Dla każdej dystrybucji istnieje potencjalnie nieskończona liczba momentów. Wystarczająco dużo momentów prawie zawsze w pełni scharakteryzuje i rozprowadzi (ustalenie niezbędnych warunków, aby być pewnym, jest częścią problemu chwili ). W statystykach często mówi się o czterech chwilach:
Rzadko rozmawiamy o chwilach poza Kurtosis, właśnie dlatego, że jest w nich bardzo mało intuicji. Jest to podobne do zatrzymania fizyków po drugiej chwili.
źródło
To trochę stary wątek, ale chcę poprawić zniekształcenie w komentarzu Fg Nu, który napisał: „Momenty są parametryzowane przez liczby naturalne i całkowicie charakteryzują rozkład”.
Momenty NIE w pełni charakteryzują rozkład. W szczególności znajomość wszystkich nieskończonej liczby chwil, nawet jeśli one istnieją, niekoniecznie jednoznacznie określa rozkład.
Według mojej ulubionej książki o prawdopodobieństwie, Fellera „Wprowadzenie do teorii prawdopodobieństwa i jej zastosowania, tom II” (patrz moja odpowiedź w rzeczywistych przykładach wspólnych rozkładów ), sekcja VII.3, przykład na str. 227–228, Lognormal nie jest określony według jego momentów, co oznacza, że istnieją inne rozkłady mające całą nieskończoną liczbę momentów taką samą jak Lognormal, ale różne funkcje dystrybucji. Jak powszechnie wiadomo, funkcja generowania momentu nie istnieje dla Lognormal, ani nie może być dla innych rozkładów posiadających te same momenty.
rozbieżne. Pamiętaj, że nie jest to tylko wtedy, gdy. Ten warunek nie odnosi się do Lognormal i faktycznie nie jest determinowany przez jego chwile.
Z drugiej strony rozkłady (zmienne losowe), które dzielą całą nieskończoną liczbę momentów, mogą się różnić tylko tak bardzo, z powodu nierówności, które można wyprowadzić z ich momentów.
źródło
Następstwem uwag Glen_b jest to, że pierwszy moment, środek, odpowiada środkowi ciężkości obiektu fizycznego, a drugi moment wokół środka, wariancja, odpowiada momentowi bezwładności. Potem jesteś sam.
źródło
Drzewo dwumianowe ma dwie gałęzie, z których każda ma prawdopodobnie 0,5. W rzeczywistości p = 0,5, a q = 1-0,5 = 0,5. Generuje to rozkład normalny z równomiernie rozłożoną masą prawdopodobieństwa.
W rzeczywistości musimy założyć, że każda warstwa w drzewie jest kompletna. Kiedy dzielimy dane na pojemniki, otrzymujemy rzeczywistą liczbę z podziału, ale zaokrąglamy w górę. Cóż, ten poziom jest niekompletny, więc nie otrzymujemy histogramu zbliżającego się do normy.
Zmień prawdopodobieństwo rozgałęzienia na p = 0,9999 i q = 0,0001, a to sprawi, że wypaczimy normalne. Przesunięta masa prawdopodobieństwa. To wyjaśnia skośność.
Niepełne poziomy lub kosze mniejsze niż 2 ^ n generują drzewa dwumianowe o obszarach, które nie mają masy prawdopodobieństwa. To daje nam kurtozę.
Odpowiedź na komentarz:
Kiedy mówiłem o określeniu liczby przedziałów, zaokrąglij w górę do następnej liczby całkowitej.
Maszyny Quincunx upuszczają piłki, które ostatecznie przybliżają normalny rozkład przez dwumian. Taka maszyna przyjmuje kilka założeń: 1) liczba przedziałów jest skończona, 2) podstawowe drzewo jest binarne, i 3) prawdopodobieństwa są ustalone. Maszyna Quincunx w Museum of Mathematics w Nowym Jorku pozwala użytkownikowi dynamicznie zmieniać prawdopodobieństwa. Prawdopodobieństwa mogą ulec zmianie w dowolnym momencie, nawet przed ukończeniem bieżącej warstwy. Stąd pomysł, że pojemniki nie są wypełnione.
W przeciwieństwie do tego, co powiedziałem w mojej oryginalnej odpowiedzi, gdy masz pustkę na drzewie, rozkład pokazuje kurtozę.
Patrzę na to z perspektywy systemów generatywnych. Używam trójkąta do podsumowywania drzew decyzyjnych. Gdy podejmowana jest nowatorska decyzja, dodaje się więcej pojemników u podstawy trójkąta i pod względem rozkładu w ogonach. Przycinanie poddrzewa z drzewa pozostawiłoby puste przestrzenie w masie prawdopodobieństwa rozkładu.
Odpowiedziałem tylko, aby dać ci intuicyjny sens. Etykiety? Korzystałem z programu Excel i grałem z prawdopodobieństwami w dwumianach i wygenerowałem oczekiwane skośności. Nie zrobiłem tego z kurtozą, nie pomaga to, że jesteśmy zmuszeni myśleć o masie prawdopodobieństwa jako statycznej podczas używania języka sugerującego ruch. Podstawowe dane lub kulki powodują kurtozę. Następnie analizujemy to na różne sposoby i przypisujemy do kształtowania opisowych terminów, takich jak środek, ramię i ogon. Jedyne, z czym musimy pracować, to pojemniki. Pojemniki żyją dynamicznym życiem, nawet jeśli dane nie mogą.
źródło