Słyszałem (przepraszam, nie mogę podać linku do tekstu, coś mi powiedziano), że wysoka dodatnia kurtoza reszt może być problematyczna dla dokładnych testów hipotez i przedziałów ufności (a zatem problemów z wnioskowaniem statystycznym). Czy to prawda, a jeśli tak, to dlaczego? Czy wysoka dodatnia kurtoza reszt nie wskazywałaby, że większość reszt jest zbliżona do średniej resztkowej 0, a zatem są obecne mniej duże reszty? (Jeśli masz odpowiedź, spróbuj udzielić odpowiedzi z niezbyt głęboką matematyką, ponieważ nie jestem bardzo skłonny matematycznie).
14
Odpowiedzi:
W przypadku niektórych rodzajów testu hipotez jest to prawda.
Nie.
Wygląda na to, że łączysz koncepcję wariancji z koncepcją kurtozy. Gdyby wariancja była mniejsza, wówczas pojawiałaby się tendencja do powstawania większej liczby małych reszt i mniejszej liczby dużych reszt. Wyobraź sobie, że utrzymujemy stałą odchylenia standardowego podczas zmiany kurtozy (więc zdecydowanie mówimy o zmianach w kurtozie zamiast wariancji).
Porównaj różne wariancje (ale tę samą kurtozę):
z inną kurtozą, ale z tą samą wariancją:
(zdjęcia z tego postu )
Wysoka kurtoza jest w wielu przypadkach związana z większą liczbą małych odchyleń od średniej - więcej małych reszt niż w normalnym rozkładzie .. ale aby utrzymać standardowe odchylenie na tej samej wartości, musimy również mieć więcej duże reszty (ponieważ posiadanie większej liczby małych reszty zmniejszyłoby typową odległość od średniej). Aby uzyskać więcej zarówno dużych, jak i małych, będziesz mieć mniej resztek „typowych rozmiarów” - tych o około jedno odchylenie standardowe od średniej.‡
Wyższa kurtoza zwykle idzie w parze z większymi resztami, nawet gdy utrzymujesz stałą wariancji.
[Ponadto w niektórych przypadkach koncentracja małych reszt może w rzeczywistości prowadzić do większego problemu niż dodatkowy ułamek największych reszt - w zależności od tego, na co patrzysz.]
W każdym razie spójrzmy na przykład. Rozważ test t dla jednej próbki i wielkość próby 10.
Jeśli odrzucimy hipotezę zerową, gdy wartość bezwzględna statystyki t jest większa niż 2,222, wówczas gdy obserwacje są niezależne, identycznie rozłożone od rozkładu normalnego, a hipotetyczna średnia jest prawdziwą średnią populacji, odrzucimy zerową hipoteza 5% czasu.
Rozważmy szczególny rozkład z znacznie wyższą kurtozą niż normalnie: 75% naszej populacji ma swoje wartości z rozkładu normalnego, a pozostałe 25% ma swoje wartości z rozkładu normalnego z odchyleniem standardowym 50 razy większym.
Jeśli poprawnie obliczyłem, odpowiada to kurtozie 12 (nadmiar kurtozy 9). Wynikowy rozkład jest znacznie bardziej szczytowy niż normalny i ma ciężkie ogony. Gęstość jest porównywana z normalną gęstością poniżej - widać wyższy szczyt, ale tak naprawdę nie widać cięższego ogona na lewym zdjęciu, więc wykreśliłem również logarytm gęstości, który rozciąga dolną część obraz i kompresuje górę, dzięki czemu łatwiej zobaczyć zarówno szczyt, jak i ogony.
Rzeczywisty poziom istotności dla tego rozkładu, jeśli przeprowadza się „5%” jeden przykładowy test t o jest mniejsza niż 0,9%. Jest to dość dramatyczne i dość znacząco obniża krzywą mocy.n = 10
(Zobaczysz także istotny wpływ na zasięg przedziałów ufności.)
Zauważ, że inny rozkład z tą samą kurtozą, co będzie miał inny wpływ na poziom istotności.
Dlaczego więc spada liczba odrzuceń? Jest tak, ponieważ cięższy ogon prowadzi do kilku dużych wartości odstających, co ma nieco większy wpływ na odchylenie standardowe niż na średnią; wpływa to na statystyki t, ponieważ prowadzi do większej wartości t między -1 a 1, w procesie zmniejszając proporcję wartości w obszarze krytycznym.
Jeśli weźmiesz próbkę, która wygląda całkiem spójnie z pochodzeniem z rozkładu normalnego, którego średnia jest wystarczająco daleko powyżej hipotetycznej średniej, że jest znacząca, a następnie weźmiesz obserwację najdalej ponad średnią i odciągniesz ją jeszcze dalej (to znaczy pomnóż średnią jeszcze większą niż pod ), faktycznie zmniejszysz statystykę t .H0
Pokażę ci. Oto próbka rozmiaru 10:
Wyobraź sobie, że chcemy go przetestować pod (test t dla jednej próbki). Okazuje się, że średnia próbki tutaj wynosi 2,68, a odchylenie standardowe próbki wynosi 0,9424. Otrzymujesz statystykę t wynoszącą 2,282 - tylko w regionie odrzucenia dla testu 5% (wartość p 0,0484).H0:μ=2
Teraz uczyń tę największą wartość 50:
Wyraźnie podnosimy średnią, więc powinna wskazywać na różnicę nawet bardziej niż wcześniej, prawda? Nie, nie ma. Statystyka t spada . Obecnie wynosi 1,106, a wartość p jest dość duża (blisko 30%). Co się stało? Cóż, podnieśliśmy średnią (do 7,277), ale standardowe odchylenie wzrosło powyżej 15.
Odchylenia standardowe są nieco bardziej wrażliwe na wartości odstające niż średnie - po wprowadzeniu wartości odstającej masz tendencję do popychania statystyki t dla jednej próby w kierunku 1 lub -1.
Jeśli istnieje szansa na kilka wartości odstających, to samo dzieje się tylko wtedy, gdy czasami mogą znajdować się po przeciwnych stronach (w takim przypadku odchylenie standardowe jest jeszcze bardziej zawyżone, podczas gdy wpływ na średnią jest zmniejszony w porównaniu do jednej wartości odstającej), więc statystyka t ma tendencję do zbliżania się do 0.
Podobne rzeczy dzieją się z wieloma innymi powszechnymi testami, które zakładają normalność - wyższa kurtoza zwykle wiąże się z cięższymi ogonami, co oznacza więcej wartości odstających, co oznacza, że standardowe odchylenia są zawyżone w stosunku do średnich, a więc różnice, które chcesz wykryć, mają tendencję zostać „zalanym” przez wpływ wartości odstających na test. To znaczy niska moc.
źródło
Kurtosis mierzy wartości odstające. Wartości odstające są problematyczne dla standardowych wniosków (np. Testów t, przedziałów t), które są oparte na rozkładzie normalnym. To koniec historii! To naprawdę bardzo prosta historia.
Powodem, dla którego ta historia nie jest doceniana, jest fakt, że wciąż istnieje starożytny mit, że kurtoza mierzy „szczytowość”.
Oto proste wyjaśnienie pokazujące, dlaczego kurtoza mierzy wartości odstające, a nie „szczytowość”.
Rozważ następujący zestaw danych.
0, 3, 4, 1, 2, 3, 0, 2, 1, 3, 2, 0, 2, 2, 3, 2, 5, 2, 3, 1
Kurtosis jest oczekiwaną wartością (wartości z) ^ 4. Oto (wartości z) ^ 4:
6,51, 0,30, 5,33, 0,45, 0,00, 0,30, 6,51, 0,00, 0,45, 0,30, 0,00, 6,51, 0,00, 0,00, 0,30, 0,00, 27,90, 0,00, 0,30, 0,45
Średnia wynosi 2,78 i jest to szacunek kurtozy. (Odejmij 3, jeśli chcesz nadmiar kurtozy.)
Teraz zamień ostatnią wartość danych na 999, aby stała się wartością odstającą:
0, 3, 4, 1, 2, 3, 0, 2, 1, 3, 2, 0, 2, 2, 3, 2, 5, 2, 3, 999
Oto (wartości z) ^ 4:
0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00,0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 360,98
Średnia to 18,05, i to jest szacunek kurtozy. (Odejmij 3, jeśli chcesz nadmiar kurtozy.)
Oczywiście liczą się tylko wartości odstające. Nie ma nic o „szczycie” ani danych w pobliżu środka.
Jeśli wykonasz standardowe analizy statystyczne z drugim zestawem danych, powinieneś spodziewać się kłopotów. Duża kurtoza ostrzega o problemie.
Oto artykuł, który rozwija:
Westfall, PH (2014). Kurtosis as Peakedness, 1905 - 2014. RIP The American Statistician, 68, 191–195.
źródło
Kurtoza wskazuje również na asymetryczne ogony. W dwustronnym teście hipotezy jeden ogon będzie długim ogonem, a drugi krótkim ogonem. Jeden z ogonów może być> alfa, ale <beta. Jeden ogon przekroczyłby wartość p, ale drugi nie.
Zasadniczo wnioskowanie statystyczne zakłada standardową normę. Jeśli nie jest to normalna norma, możesz sobie pozwolić na wnioskowanie oparte na bardziej zaawansowanej mechanice wnioskowania. Możesz być w stanie nas wnioskować Poissona, ale przy rozkładzie, który nie jest normalny, nie możesz używać wnioskowania opartego na normalnych.
Skośność i kurtoza są miarą nienormalności. Uczymy się przyjmować środki i używać normalnych rozkładów, zanim będziemy wiedzieć, że musimy przetestować normalność. Normalna wymaga 36 lub więcej punktów danych z każdego wymiaru. Możesz oszacować na 20 punktów danych, ale nadal będziesz mieć przekrzywienie i kurtozę. Gdy rozkład zbliża się do normalności, pochylenie i rozkład znikają.
Jedno z wyjaśnień zdefiniowało kurtozę jako szczytowość. Inny nie. W tej chwili jest to nierozstrzygnięta walka. Kurtosis to czwarty moment, obszar. Jestem na szczycie tego problemu.
Innym pomysłem, który istnieje, jest to, że z pochyleniem mediana przechyla się do trybu tworzącego trójkąt. Cieszyć się.
źródło