Jak interpretować wartość F i p w ANOVA?

40

Jestem nowy w statystyce i obecnie zajmuję się ANOVA. Przeprowadzam test ANOVA w R. używając

aov(dependendVar ~ IndependendVar)

Dostaję - między innymi - wartość F i wartość p.

Moja hipoteza ( ) jest taka, że ​​wszystkie średnie grupowe są równe.H.0

Dostępnych jest wiele informacji na temat sposobu obliczania F , ale nie wiem, jak odczytać statystykę F i jak są połączone F i p.

Tak więc moje pytania to:

  1. Jak określić krytyczną wartość F dla odrzucenia ?H.0
  2. Czy każdy F ma odpowiednią wartość p, więc oba oznaczają w zasadzie to samo? (np. jeśli , to jest odrzucany)H 0p<0,05H.0
JanD
źródło
1
Próbowałeś już poleceń summary(aov(dependendVar ~ IndependendVar)))lub summary(lm(dependendVar ~ IndependendVar))? Czy masz na myśli, że wszystkie średnie grupy są sobie równe i równe 0 lub tylko sobie nawzajem?
RyanB
tak, próbowałem summary(aov...). Dzięki za lm.*, nie wiedziałem o tym :-) Nie rozumiem, co masz na myśli równą 0. Jeśli to skrót od mojej 0-Hipotezi, to Hipoteza potrzebowałaby wartości, a ja nie testowałem na konkretnej, więc w tym przypadku: tylko dla siebie!
JanD
1
Aby uzyskać intuicyjne wyjaśnienie, zajrzyj na blog Yhat na temat regresji.
DataTx

Odpowiedzi:

14

Aby odpowiedzieć na pytania:

  1. Znajdziesz krytyczną wartość F z rozkładu F (tutaj jest tabela ). Zobacz przykład . Musisz być ostrożny w stosunku do jednokierunkowego kontra dwukierunkowego stopnia swobody licznika i mianownika.

  2. Tak.

dfrankow
źródło
Nie ma sensu mówić o porównaniach jedno- lub dwukierunkowych w teście zbiorczym, takim jak test F.
Marcus Morrisey
3
Marcus Morrisey: Myślę, że mylisz jeden kontra dwa ogony z jeden na dwa dwustronne. Test F nie ma wielu „ogonów” do wyboru, ale przy konstruowaniu statystyki testowej należy wziąć pod uwagę jednostronną ANOVA vs. dwustronną ANOVA.
Emiller,
29

Statystyka F to stosunek 2 różnych miar wariancji dla danych. Jeśli hipoteza zerowa jest prawdziwa, oba są szacunkami tej samej rzeczy, a stosunek wyniesie około 1.

Licznik jest obliczany przez pomiar wariancji średnich, a jeśli prawdziwe średnie grup są identyczne, jest to funkcja ogólnej wariancji danych. Ale jeśli hipoteza zerowa jest fałszywa, a średnie nie są równe, wówczas ta miara wariancji będzie większa.

Mianownik to średnia wariancji próby dla każdej grupy, która jest oszacowaniem ogólnej wariancji populacji (przy założeniu, że wszystkie grupy mają równe wariancje).

Więc gdy zero wszystkich średnich równych jest prawdziwe, wówczas 2 miary (z pewnymi dodatkowymi terminami dla stopni swobody) będą podobne, a stosunek będzie bliski 1. Jeśli zero jest fałszywe, licznik będzie duży względem mianownik i stosunek będą większe niż 1. Spojrzenie tego stosunku na tabeli F (lub obliczenie go za pomocą funkcji takiej jak pf w R) da wartość p.

Jeśli wolisz użyć regionu odrzucania niż wartości p, możesz użyć tabeli F lub funkcji qf w R (lub innym oprogramowaniu). Rozkład F ma 2 rodzaje stopni swobody. Licznikowe stopnie swobody oparte są na liczbie grup, które porównujesz (dla 1-kierunkowego jest to liczba grup minus 1), a mianownik stopnie swobody oparte są na liczbie obserwacji w grupach (dla 1- jest to liczba obserwacji minus liczba grup). W przypadku bardziej skomplikowanych modeli stopnie swobody stają się bardziej skomplikowane, ale kieruj się podobnymi pomysłami.

Greg Snow
źródło
Dziękuję za wyjaśnienie! Zakładam, że jeśli mogę sprawdzić wartość F w tabeli, aby zobaczyć wartość p, to p i F to tylko dwa sposoby wyrażenia prawdopodobieństwa, że ​​wynik podobny do analizowanego może wystąpić, jeśli H0 ma rację?
JanD
2
We wszystkich statystykach parametrycznych istnieje bezpośredni związek funkcjonalny między statystyką testową (w tym przypadku F) a wartością p. Zostały one umieszczone w tabeli dla wygody, ale można je również obliczyć bezpośrednio. Możesz albo użyć alfa, aby znaleźć punkt odcięcia dla regionu krytycznego, aby porównać statystyki testowe (do których myślę, że jest bardziej intuicyjny), albo użyć obliczonej statystyki testowej, aby znaleźć wartość p do porównania z alfa. W obu przypadkach zaczynamy od poziomu alfa i formuły statystyki testowej, która podąża za danym rozkładem, gdy wartość null jest prawdziwa.
Greg Snow
20

fap

wprowadź opis zdjęcia tutaj

fafafapfafapfap

Powinieneś zauważyć kilka innych rzeczy na temat rozkładu pod hipotezą zerową:

fa

fa

dodofadopp=0,175

fafarefa1=3)refa1=2)

wprowadź opis zdjęcia tutaj

faχ2)χ2)faχ2)zfatt

To o wiele więcej, niż zamierzałem pisać, ale mam nadzieję, że obejmuje to twoje pytania!

(Jeśli zastanawiasz się, skąd pochodzą diagramy, zostały one automatycznie wygenerowane przez mój pakiet statystyk pulpitu, Wizard ).

Emiller
źródło