Stopnie swobody w mojej tabeli F nie są wystarczająco wysokie dla mojej dużej próbki.
Na przykład, jeśli mam F z 5 i 6744 stopniami swobody, jak znaleźć 5% wartość krytyczną dla ANOVA?
Co jeśli robiłbym test chi-kwadrat z dużymi stopniami swobody?
[Takie pytanie zostało zadane jakiś czas temu, ale OP popełnił błąd i faktycznie miał mniejszy plik df, zmniejszając go do duplikatu - ale oryginalne duże pytanie df powinno znaleźć odpowiedź gdzieś na stronie]
chi-squared
degrees-of-freedom
f-distribution
tables
Glen_b - Przywróć Monikę
źródło
źródło
Odpowiedzi:
Tabele F :
Najłatwiejszym ze wszystkich - jeśli możesz - jest użycie pakietu statystyk lub innego programu, który zapewni ci wartość krytyczną. Na przykład w R możemy to zrobić:
(ale równie łatwo można obliczyć dokładną wartość p dla swojego F).
Zwykle tabele F mają stopnie swobody „nieskończoności” na końcu tabeli, ale kilka nie. Jeśli masz naprawdę duży plik df (na przykład 6744 jest naprawdę duży), możesz zamiast niego użyć wpisu infinity ( ).∞
Więc możesz mieć tabele dla które dają 120 df i df:ν1=5 ∞
df rzędu nie będzie działać na dowolnym naprawdę duże (mianownik df). Jeśli użyjemy tego, mamy 2.2141 zamiast dokładnego 2.2154, ale nie jest tak źle.∞ ν2
Jeśli nie masz wpisanego stopnia swobody nieskończoności, możesz wypracować jeden z tabeli chi-kwadrat, używając wartości krytycznej dla licznika df podzielonego przez te df
Na przykład dla wartości krytycznej weź wartość krytyczną i podziel przez . 5% wartości krytycznej dla wynosi . Jeśli podzielimy przez , będzie to co jest wierszem z powyższej tabeli.F5,∞ χ25 5 χ25 11.0705 5 2.2141 ∞
Jeśli twoje stopnie swobody mogą być nieco za małe, aby użyć wpisu „nieskończoność” (ale nadal są znacznie większe niż 120 lub cokolwiek, do czego zmierza twoja tabela), możesz użyć odwrotnej interpolacji między najwyższym skończonym df a wpisem nieskończoności. Powiedzmy, że chcemy obliczyć wartość krytyczną dla dfF5,674
Następnie obliczamy nieznaną wartość krytyczną, asC
(Dokładna wartość to , więc działa całkiem dobrze.)2.2274
Więcej szczegółów na temat interpolacji i interpolacji odwrotnej podano w tym powiązanym poście.
Stoły chi-kwadrat :
Jeśli twój chi-kwadrat df jest naprawdę duży, możesz użyć normalnych tabel, aby uzyskać przybliżenie.
Dla dużego df rozkład chi-kwadrat jest w przybliżeniu normalny ze średnią i wariancją . Aby uzyskać górną wartość 5%, weź jednostronną wartość krytyczną 5% dla standardowej wartości normalnej ( ) i pomnóż ją przez i dodaj .ν ν 2ν 1.645 2ν−−√ ν
Wyobraźmy sobie na przykład, że potrzebujemy górnej 5% wartości krytycznej dla .χ26744
Chcemy obliczyć . Dokładna odpowiedź (do cyfr znaczących) to .1.645×2×6744−−−−−−−√+6744≈6935 5 6936.2
Jeśli stopnie swobody są mniejsze, możemy użyć faktu, że jeśli to to .X χ2ν 2X−−−√∼˙N(2ν−1−−−−−√,1)
Na przykład, gdybyśmy mieli df, moglibyśmy zastosować to przybliżenie. Dokładna górna 5% wartość krytyczna dla chi-kwadrat z 674 df wynosi (do 5 cyfr) . Przy takim przybliżeniu obliczymy w następujący sposób:674 735.51
Weź górną (jednostronną) 5% wartość krytyczną dla standardowej wartości normalnej (1.645), dodaj , potęguj kwadrat i podziel przez 2. W tym przypadku:2ν−1−−−−−√
Jak widzimy, jest to dość bliskie.
W przypadku znacznie mniejszych stopni swobody można zastosować transformację Wilsona-Hilferty'ego - działa ona aż do kilku stopni swobody - ale tabele powinny to obejmować. To przybliżenie jest takie, że .(Xν)13∼˙N(1−29ν,29ν)
źródło
R
df2/df1 * (-1 + 1/(1-qchisq(0.95, df1) / df2))