Jestem nowy w statystyce i obecnie zajmuję się ANOVA. Przeprowadzam test ANOVA w R. używając
aov(dependendVar ~ IndependendVar)
Dostaję - między innymi - wartość F i wartość p.
Moja hipoteza ( ) jest taka, że wszystkie średnie grupowe są równe.
Dostępnych jest wiele informacji na temat sposobu obliczania F , ale nie wiem, jak odczytać statystykę F i jak są połączone F i p.
Tak więc moje pytania to:
- Jak określić krytyczną wartość F dla odrzucenia ?
- Czy każdy F ma odpowiednią wartość p, więc oba oznaczają w zasadzie to samo? (np. jeśli , to jest odrzucany)H 0
r
anova
interpretation
JanD
źródło
źródło
summary(aov(dependendVar ~ IndependendVar)))
lubsummary(lm(dependendVar ~ IndependendVar))
? Czy masz na myśli, że wszystkie średnie grupy są sobie równe i równe 0 lub tylko sobie nawzajem?summary(aov...)
. Dzięki zalm.*
, nie wiedziałem o tym :-) Nie rozumiem, co masz na myśli równą 0. Jeśli to skrót od mojej 0-Hipotezi, to Hipoteza potrzebowałaby wartości, a ja nie testowałem na konkretnej, więc w tym przypadku: tylko dla siebie!Odpowiedzi:
Aby odpowiedzieć na pytania:
Znajdziesz krytyczną wartość F z rozkładu F (tutaj jest tabela ). Zobacz przykład . Musisz być ostrożny w stosunku do jednokierunkowego kontra dwukierunkowego stopnia swobody licznika i mianownika.
Tak.
źródło
Statystyka F to stosunek 2 różnych miar wariancji dla danych. Jeśli hipoteza zerowa jest prawdziwa, oba są szacunkami tej samej rzeczy, a stosunek wyniesie około 1.
Licznik jest obliczany przez pomiar wariancji średnich, a jeśli prawdziwe średnie grup są identyczne, jest to funkcja ogólnej wariancji danych. Ale jeśli hipoteza zerowa jest fałszywa, a średnie nie są równe, wówczas ta miara wariancji będzie większa.
Mianownik to średnia wariancji próby dla każdej grupy, która jest oszacowaniem ogólnej wariancji populacji (przy założeniu, że wszystkie grupy mają równe wariancje).
Więc gdy zero wszystkich średnich równych jest prawdziwe, wówczas 2 miary (z pewnymi dodatkowymi terminami dla stopni swobody) będą podobne, a stosunek będzie bliski 1. Jeśli zero jest fałszywe, licznik będzie duży względem mianownik i stosunek będą większe niż 1. Spojrzenie tego stosunku na tabeli F (lub obliczenie go za pomocą funkcji takiej jak pf w R) da wartość p.
Jeśli wolisz użyć regionu odrzucania niż wartości p, możesz użyć tabeli F lub funkcji qf w R (lub innym oprogramowaniu). Rozkład F ma 2 rodzaje stopni swobody. Licznikowe stopnie swobody oparte są na liczbie grup, które porównujesz (dla 1-kierunkowego jest to liczba grup minus 1), a mianownik stopnie swobody oparte są na liczbie obserwacji w grupach (dla 1- jest to liczba obserwacji minus liczba grup). W przypadku bardziej skomplikowanych modeli stopnie swobody stają się bardziej skomplikowane, ale kieruj się podobnymi pomysłami.
źródło
Powinieneś zauważyć kilka innych rzeczy na temat rozkładu pod hipotezą zerową:
To o wiele więcej, niż zamierzałem pisać, ale mam nadzieję, że obejmuje to twoje pytania!
(Jeśli zastanawiasz się, skąd pochodzą diagramy, zostały one automatycznie wygenerowane przez mój pakiet statystyk pulpitu, Wizard ).
źródło