Różnica między testem t a ANOVA w regresji liniowej

12

Zastanawiam się, jakie są różnice między testem t a ANOVA w regresji liniowej?

  1. Czy test t sprawdza, czy którykolwiek z nachyleń i przecięcia ma średnią zero, podczas gdy ANOVA sprawdza, czy wszystkie nachylenia mają średnią zero? Czy to jedyna różnica między nimi?
  2. W prostej regresji liniowej, tj. Gdy istnieje tylko jedna zmienna predykcyjna, istnieje tylko jedno nachylenie do oszacowania. Czy test t i ANOVA są równoważne, a jeśli tak, to w jaki sposób, biorąc pod uwagę, że wykorzystują one inne statystyki (test t używa statystyki t, a ANOVA używa statystyki F)?
Tim
źródło
Ad 1) W regresji liniowej normalnie rozumiem ANOVA jako miarę dobroci dopasowania modelu, tj. Do decydowania, czy model (linia regresji) wyjaśnia istotną część całkowitej zmienności. Pytanie, czy jest równoważne zeru na wszystkich zboczach, jest naprawdę bardzo interesujące. Ad 2) wygląda na to, że w tym przypadku otrzymuję prawie takie same wartości p dla testu t i ANOVA regresji. Naprawdę ciekawe twierdzenie!
Ciekawe

Odpowiedzi:

18

Ogólny model liniowy pozwala nam napisać model ANOVA jako model regresji. Załóżmy, że mamy dwie grupy z dwiema obserwacjami, tj. Cztery obserwacje w wektorze . Zatem pierwotnym, nadparametryzowanym modelem jest E ( y ) = X β , gdzie X jest macierzą predyktorów, tj. Zmiennych wskaźnikowych kodowanych obojętnie : ( μ 1 μ 1 μ 2 μ 2 ) = ( 1 1 0 1 1 0 1 0 1 1 0 1yE(y)=XβX

(μ1μ1μ2μ2)=(110110101101)(β0β1β2)

Parametry nie są identyfikowalne jako ponieważ X ma rangę 2 ( ( X ) X nie jest odwracalna). Aby to zmienić, wprowadzamy ograniczenie β 1 = 0 (kontrasty leczenia), co daje nam nowy model E ( y ) = X β : (((X)X)1(X)E(y)X(X)Xβ1=0E(y)=Xβ

(μ1μ1μ2μ2)=(10101111)(β0β2)

μ1=β0β0μ2=β0+β2β2μ2μ1

tψ=cjβjψ0c=(0,1)β2=0μ2μ1=0ψ^=cjβ^jβ^=(XX)1Xyψ

t=ψ^ψ0σ^c(XX)1c

e2Rnk(x)=2(X'X)-1X"=( 0,5 0,5 0 0 - 0,5 - 0,5 0,5 0,5 ) β 0=0,5σ^2=e2/(nRank(X))e2Rank(X)=2(XX)1X=(.5.500.5.5.5.5)β^0=0.5y1+0.5y2=M1β^2=0.5y10.5y2+0.5y3+0.5y4=M2M1c(XX)1c

t=M2M10σ^=M2M1e2/(n2)

t jest -dystrybucja z df (tutaj ). Kiedy kwadrat , otrzymujesz , statystyka testowa z testu ANOVA dla dwóch grup ( dla pomiędzy, dla wewnątrz grup), który następuje po - rozkład z 1 in df.tnRank(X)n2tFbwFn-Rank(X)(M2M1)2/1e2/(n2)=SSb/dfbSSw/dfw=FFbwFnRank(X)

Przy więcej niż dwóch grupach hipoteza ANOVA (wszystkie mają jednocześnie 0, z ) odnosi się do więcej niż jednego parametru i nie może być wyrażona jako kombinacja liniowa , więc testy nie są równoważne . 1 j ψβj1jψ

karakal
źródło
3

W 1 ANOVA zwykle bada zmienne czynnikowe i czy różnica między grupami jest znacząca. Wyraźnie zobaczysz różnicę, jeśli twoje oprogramowanie zezwala na zmienne wskaźnikowe w regresji: dla każdego manekina dostaniesz wartość p, mówiąc, czy wyniki tej grupy znacznie różnią się od 0, aw konsekwencji znacznie różnią się od stosowanej grupy odniesienia lub wartości odniesienia . Zwykle nie zobaczysz, w jakim stopniu sam wskaźnik jest ważny, dopóki nie wykonasz testu ANOVA.

Test F jest kwadratowym testem t. Dlatego w 2 jest tak samo.

Rodzić
źródło
Dzięki! (1) Co oznaczają tutaj zmienne wskaźnikowe? (2) Zasadniczo test t jest równoważny z ANOVA tylko wtedy, gdy istnieją tylko dwie grupy. Ale w prostej regresji liniowej mogą istnieć więcej niż dwie grupy, gdzie liczba grup jest liczbą wartości, które zmienna predykcyjna przyjmuje w zbiorze danych.
Tim
(1) Wskaźnik lub zmienna kategorialna lub czynnikowa ... wszystko jedno. (2) Rzeczywiście, ale możesz chcieć wiedzieć, jak dobrze zestaw manekinów / kategorii wyniki z ANOVA.
Labor
Dzięki! (2) Więc w prostej regresji liniowej, w jaki sposób test t jest równoważny ANOVA, skoro istnieją więcej niż dwie grupy? Co znaczy „jak dobrze zestaw wyników manekinów / kategorii z ANOVA” i dlaczego chcę to wiedzieć?
Tim
W regresji OLS R² (wyjaśniona wariancja) będzie równy eta² lub MSS / TSS z ANOVA bez względu na to, ile grup zdefiniujesz. Następnie możesz chcieć poznać wkład zestawu manekinów (tj. Zmienną wskaźnikową), aby powiedzieć, czy sam zestaw jest odpowiedni i w jakim zakresie, który różni się od znaczenia różnicy między jedną kategorią a kategorią odniesienia .
Labour