Zastanawiam się, jakie są różnice między testem t a ANOVA w regresji liniowej?
- Czy test t sprawdza, czy którykolwiek z nachyleń i przecięcia ma średnią zero, podczas gdy ANOVA sprawdza, czy wszystkie nachylenia mają średnią zero? Czy to jedyna różnica między nimi?
- W prostej regresji liniowej, tj. Gdy istnieje tylko jedna zmienna predykcyjna, istnieje tylko jedno nachylenie do oszacowania. Czy test t i ANOVA są równoważne, a jeśli tak, to w jaki sposób, biorąc pod uwagę, że wykorzystują one inne statystyki (test t używa statystyki t, a ANOVA używa statystyki F)?
regression
anova
t-test
Tim
źródło
źródło
Odpowiedzi:
Ogólny model liniowy pozwala nam napisać model ANOVA jako model regresji. Załóżmy, że mamy dwie grupy z dwiema obserwacjami, tj. Cztery obserwacje w wektorze . Zatem pierwotnym, nadparametryzowanym modelem jest E ( y ) = X ⋆ β ⋆ , gdzie X ⋆ jest macierzą predyktorów, tj. Zmiennych wskaźnikowych kodowanych obojętnie : ( μ 1 μ 1 μ 2 μ 2 ) = ( 1 1 0 1 1 0 1 0 1 1 0 1y mi( y) = X⋆β⋆ X⋆
Parametry nie są identyfikowalne jako ponieważ X ⋆ ma rangę 2 ( ( X ⋆ ) ′ X ⋆ nie jest odwracalna). Aby to zmienić, wprowadzamy ograniczenie β ⋆ 1 = 0 (kontrasty leczenia), co daje nam nowy model E ( y ) = X β : (( ( X⋆)′X⋆)- 1( X⋆)′mi( y) X⋆ ( X⋆)′X⋆ β⋆1= 0 mi( y) = Xβ
‖e‖2Rnk(x)=2(X'X)-1X"=( 0,5 0,5 0 0 - 0,5 - 0,5 0,5 0,5 ) β 0=0,5σ^2)= ∥ e ∥2)/ (n- R a n k (X) ) ∥e∥2 Rank(X)=2 (X′X)−1X′=(.5−.5.5−.50.50.5) β^0=0.5y1+0.5y2=M1 β^2=−0.5y1−0.5y2+0.5y3+0.5y4=M2−M1 c′(X′X)−1c
Przy więcej niż dwóch grupach hipoteza ANOVA (wszystkie mają jednocześnie 0, z ) odnosi się do więcej niż jednego parametru i nie może być wyrażona jako kombinacja liniowa , więc testy nie są równoważne . 1 ≤ j ψβj 1≤j ψ
źródło
W 1 ANOVA zwykle bada zmienne czynnikowe i czy różnica między grupami jest znacząca. Wyraźnie zobaczysz różnicę, jeśli twoje oprogramowanie zezwala na zmienne wskaźnikowe w regresji: dla każdego manekina dostaniesz wartość p, mówiąc, czy wyniki tej grupy znacznie różnią się od 0, aw konsekwencji znacznie różnią się od stosowanej grupy odniesienia lub wartości odniesienia . Zwykle nie zobaczysz, w jakim stopniu sam wskaźnik jest ważny, dopóki nie wykonasz testu ANOVA.
Test F jest kwadratowym testem t. Dlatego w 2 jest tak samo.
źródło