Parametr niecentralności - co to jest, co robi, jaka byłaby sugerowana wartość?

11

Próbowałem pogłębić wiedzę na temat statystyk, szczególnie w odniesieniu do określania wielkości próby i analizy mocy statystycznej. Ale wydaje się, że im więcej czytam, tym więcej muszę czytać.

W każdym razie znalazłem narzędzie o nazwie G * Power, które wydaje się robić wszystko, czego potrzebuję, ale mam problem ze zrozumieniem parametru niecentralności, co to jest, co robi, jaka byłaby sugerowana wartość itp.?

Informacje na wikipedii itp. Są niekompletne lub nie wykonuję zbyt dobrej pracy, rozumiejąc to.

Przeprowadzam serię dwóch ogonów z-testów, jeśli to pomoże.

ps Czy ktoś może dodać lepsze tagi do tego pytania?

Głęboki koniec
źródło

Odpowiedzi:

8

W obliczeniach mocy kalibrujemy testy przy użyciu wiedzy o tym, jaki rozkład próbkowania statystyki testowej byłby pod hipotezą zerową. Zwykle wynika to z:χ2)lub normalny rozkład. Pozwala to obliczyć „wartości krytyczne”, dla których wartości przekraczające tę wartość są uważane za zbyt niespójne z oczekiwaniami, gdyby zerowa była prawdziwa.

Moc testu statystycznego jest obliczana poprzez określenie modelu prawdopodobieństwa dla procesu generowania danych na podstawie hipotezy alternatywnej i obliczania rozkładu pobierania próbek do tej samej statystyki testowej. To teraz przyjmuje inną dystrybucję.

Dla statystyk testowych mających χ2) dystrybucja poniżej zera przyjmują niecentralne χ2)dystrybucja w ramach tworzonej alternatywy. Są to bardzo skomplikowane rozkłady, ale standardowe oprogramowanie może łatwo obliczyć gęstość, rozkład i kwantyle. Sztuka polega na tym, że są one konwakcją standarduχ2)gęstości i gęstości Poissona. W R, dchisq, pchisqi rchisqfunkcje mają opcjonalny ncpargument, który jest domyślnie 0.

Jeśli statystyka testowa ma standardowy rozkład normalny pod hipotezą zerową, będzie miała niezerowy średni rozkład normalny w ramach alternatywy. Tutaj ta średnia to parametr niecentryczności. W przypadku testu t przy założeniu równości wariancji średnią podaje się:

δ=μ1-μ2)σpoolmire/n

wprowadź opis zdjęcia tutaj

W obu przypadkach dane wygenerowane zgodnie z alternatywną hipotezą będą miały statystyki testowe po pewnym rozkładzie niecentralnym z parametrem niecentralności (δ). Theδ jest czasem nieznaną, często skomplikowaną funkcją innych parametrów generujących dane.

AdamO
źródło
Rozumiem, dlaczego losowe próbkowanie doprowadziłoby do normalnie rozłożonej średniej, gdyby hipoteza zerowa była prawdziwa (twoja czarna linia). Ale sieć dała mi sprzeczne opisy dystrybucji w ramach alternatywy (tj. Kiedyμ2) zakłada się, że różni się od μ1) - u Ciebie jest to również normalne (czerwona linia), ale np. real-statistics.com pokazał, że jest przekrzywiony (patrz zdjęcie w połowie strony). Z pewnością przegapiłem lewę. Czy możesz mi pomóc wyjaśnić sprawę?
Ben
@ben Nie narysowałem nieśrodkowej litery T, narysowałem moc testu statystycznego (czerwony obszar, zacieniony). Niecentralny rozkład Chi-sq opisuje ten obszar podczas obliczania mocy.
AdamO