Jak wyglądają wszystkie wersje tej samej podstawowej metody statystycznej?
regression
self-study
anova
generalized-linear-model
t-test
Amahabirsingh
źródło
źródło
Odpowiedzi:
Rozważ, że wszystkie można zapisać jako równanie regresji (być może z nieco innymi interpretacjami niż ich tradycyjne formy).
Regresja:
test t:
ANOVA:
Prototypowa regresja jest konceptualizowana za pomocą jako zmiennej ciągłej. Jednak jedynym założeniem, które jest faktycznie zrobione na temat X, jest to, że jest to wektor znanych stałych. Może to być zmienna ciągła, ale może to być również fikcyjny kod (tj. Wektor 0 i 1 , który wskazuje, czy obserwacja należy do wskazanej grupy - np. Grupy leczonej). Zatem w drugim równaniu X może być takim fałszywym kodem, a wartość p byłaby taka sama jak w teście t w jego bardziej tradycyjnej postaci.X X 0 1 X
Znaczenie bet będzie tu jednak różne. W tym przypadku, byłaby średnia w grupie kontrolnej (w której pozycje w zmiennej obojętne byłoby 0 „S) i p 1 odpowiada różnicy pomiędzy średnią z grupy leczonej oraz średnią kontrolą Grupa.β0 0 β1
Teraz pamiętaj, że całkowicie uzasadnione jest posiadanie / uruchamianie ANOVA tylko z dwiema grupami (chociaż test t byłby bardziej powszechny) i wszystkie trzy są połączone. Jeśli wolisz zobaczyć, jak by to działało, gdybyś miał ANOVA z 3 grupami; byłoby to: Zauważ, że kiedy maszgrupy g , masz g - 1 kody zastępcze, które je reprezentują. W grupie odniesienia (zwykle grupa kontrolna) jest wskazane poprzez 0 „swszystkichkodów manekina (w tym przypadku zarówno obojętne kodu 1 i obojętne numer 2). W tym przypadku nie chcesz interpretować wartości p dla testów beta dla tych bet, które mają standardowe wyniki statystyczne - wskazują one tylko, czy wskazana grupa różni się od grupy kontrolnej,gdy jest oceniana w izolacji
W świetle poniższych komentarzy @ Whubera można je również przedstawić za pomocą równań macierzowych:
Reprezentowane w ten sposób, Y i ε są wektorami o długości N , a β jest wektorem o długości p + 1 . X jest teraz macierzą z N rzędami i ( p + 1 ) kolumnami. W prototypowego regresji masz p ciągła X zmienne i wyraz wolny. Zatem twój X
Jeśli reprezentujesz w ten sposób ANOVA z grupami , pamiętaj, że miałbyś zmienne fikcyjne g - 1 wskazujące grupy, z grupą odniesienia wskazaną przez obserwację mającą 0 w każdej zmiennej fikcyjnej. Jak wyżej, nadal będziesz mieć przechwytywanie. Zatem p = g - 1 .sol sol- 1 0 p = g- 1
źródło
Wszystkie można zapisać jako szczególne przypadki ogólnego modelu liniowego.
Test t jest przypadkiem ANOVA dla dwóch próbek. Jeśli wyrównasz statystyki testu t, uzyskasz odpowiadające w ANOVA.fa
Model ANOVA jest w zasadzie tylko modelem regresji, w którym poziomy czynników są reprezentowane przez zmienne fikcyjne (lub wskaźnikowe ) .
Zwróć uwagę na wartość p 0,079 powyżej. Oto anova w jedną stronę:
Teraz regresja:
(niektóre dane wyjściowe usunięte)
Porównaj wartość p w wierszu „grupa 2”, a także wartość p dla testu F w ostatnim wierszu. W przypadku testu dwustronnego są one takie same i oba odpowiadają wynikowi testu t.
Ponadto współczynnik dla „grupy 2” reprezentuje różnicę średnich dla dwóch grup.
źródło
Ta odpowiedź , którą zamieściłem wcześniej, jest dość trafna, ale to pytanie jest nieco inne.
Możesz pomyśleć o różnicach i podobieństwach między następującymi modelami liniowymi:
źródło
Anova jest podobna do testu t dla równości średnich przy założeniu nieznanych, ale równych wariancji między zabiegami. Wynika to z faktu, że w analizie ANOVA MSE jest identyczna z wariancją z puli stosowaną w teście t. Istnieją inne wersje testu t, takie jak test na nierównomierne wariancje i test t dla par. Z tego widoku test t może być bardziej elastyczny.
źródło