(AKTUALIZACJA: Zagłębiłem się w to i opublikowałem wyniki tutaj )
Lista nazwanych testów statystycznych jest ogromna. Wiele powszechnych testów opiera się na wnioskowaniu z prostych modeli liniowych, np. Test t dla jednej próbki to po prostu y = β + ε, który jest testowany względem modelu zerowego y = μ + ε, tzn. Że β = μ, gdzie μ jest trochę zerowe wartość - zazwyczaj μ = 0.
Uważam, że jest to o wiele bardziej pouczające do celów dydaktycznych niż nauka na pamięć nazwanych modeli, kiedy ich używać i ich założeń, jak gdyby nie mieli ze sobą nic wspólnego. Takie podejście promuje nie promuje zrozumienia. Nie mogę jednak znaleźć dobrego zasobu, który to zbierze. Bardziej interesują mnie równoważności między podstawowymi modelami niż metoda wnioskowania na ich podstawie. Chociaż, o ile widzę, testy współczynnika prawdopodobieństwa na wszystkich tych liniowych modelach dają takie same wyniki jak wnioskowanie „klasyczne”.
Oto równoważności, których się nauczyłem do tej pory, ignorując termin błędu i zakładając, że wszystkie hipotezy zerowe są nieobecnością efektu:
Test t dla jednej próbki: .
Test t dla próbki sparowanej:
Jest to identyczne z testem t dla jednej próby na różnicach par.
Test t dla dwóch próbek:
gdzie x jest wskaźnikiem (0 lub 1).
Korelacja Pearsona:
Zwróć uwagę na podobieństwo do dwupróbkowego testu t, który jest po prostu regresją na binarnej osi x.
Korelacja Spearmana:
Jest to identyczne z korelacją Pearsona dla xiy przekształconych rangą.
ANOVA jednokierunkowa:
gdzie są wskaźnikami wybierającymi odpowiedni (jeden to 1; pozostałe to 0). Model może prawdopodobnie być sporządzone w postaci macierzowej jako a .
Dwukierunkowa ANOVA:
dla dwóch dwupoziomowych czynników. Powyżej są wektorami beta gdzie wybrany jest wskaźnikiem wektora . pokazany jest tu efekt interakcji.
Czy możemy dodać więcej „nazwanych testów” do tej listy modeli liniowych? Np. Regresja wielowymiarowa, inne testy „nieparametryczne”, testy dwumianowe lub RM-ANOVA?
AKTUALIZACJA: zadano pytania i odpowiedzi dotyczące ANOVA i testów t jako modeli liniowych tutaj na SO. Zobacz to pytanie i oznaczone pytania powiązane .
źródło
x = rnorm(100); y = rnorm(100); summary(lm(rank(x) ~ rank(y))); cor.test(x, y, method='spearman')
Odpowiedzi:
Nie jest to wyczerpująca lista, ale jeśli uwzględnisz uogólnione modele liniowe, zakres tego problemu staje się znacznie większy.
Na przykład:
Thep×k jest model log-liniowy dla częstotliwości komórkowych podanych przez:
Również test t dla nierównych wariancji jest dobrze aproksymowany przy użyciu solidnego oszacowania błędu Huber White.
źródło