Co robisz, jeśli twoje stopnie swobody przekraczają koniec twoich stołów?

Tabele F :

Najłatwiejszym ze wszystkich - jeśli możesz - jest użycie pakietu statystyk lub innego programu, który zapewni ci wartość krytyczną. Na przykład w R możemy to zrobić:
```
 qf(.95,5,6744)
[1] 2.215425
```
(ale równie łatwo można obliczyć dokładną wartość p dla swojego F).
Zwykle tabele F mają stopnie swobody „nieskończoności” na końcu tabeli, ale kilka nie. Jeśli masz naprawdę duży plik df (na przykład 6744 jest naprawdę duży), możesz zamiast niego użyć wpisu infinity ( ). $\infty$

Więc możesz mieć tabele dla które dają 120 df i df: $\nu_1=5$ $\infty$
```
      ...    5      ...
 ⁞
120        2.2899   
 ∞         2.2141
```
df rzędu nie będzie działać na dowolnym naprawdę duże (mianownik df). Jeśli użyjemy tego, mamy 2.2141 zamiast dokładnego 2.2154, ale nie jest tak źle. $\infty$ $\nu_2$
Jeśli nie masz wpisanego stopnia swobody nieskończoności, możesz wypracować jeden z tabeli chi-kwadrat, używając wartości krytycznej dla licznika df podzielonego przez te df

Na przykład dla wartości krytycznej weź wartość krytyczną i podziel przez . 5% wartości krytycznej dla wynosi . Jeśli podzielimy przez , będzie to co jest wierszem z powyższej tabeli. $F_{5,\infty}$ $\chi^2_5$ $5$ $\chi^2_5$ $11.0705$ $5$ $2.2141$ $\infty$
Jeśli twoje stopnie swobody mogą być nieco za małe, aby użyć wpisu „nieskończoność” (ale nadal są znacznie większe niż 120 lub cokolwiek, do czego zmierza twoja tabela), możesz użyć odwrotnej interpolacji między najwyższym skończonym df a wpisem nieskończoności. Powiedzmy, że chcemy obliczyć wartość krytyczną dla df $F_{5, 674}$
```
   F       df     120/df    
 ------   ----    -------
 2.2899    120      1     
   C       674    0.17804
 2.2141     ∞       0    
```
Następnie obliczamy nieznaną wartość krytyczną, as $C$

$C \approx 2.2141 + (2.2899-2.2141) \times (0.17804-0)/(1-0) \approx 2.2276$

(Dokładna wartość to , więc działa całkiem dobrze.) $2.2274$

Więcej szczegółów na temat interpolacji i interpolacji odwrotnej podano w tym powiązanym poście.

Stoły chi-kwadrat :

Jeśli twój chi-kwadrat df jest naprawdę duży, możesz użyć normalnych tabel, aby uzyskać przybliżenie.

Dla dużego df rozkład chi-kwadrat jest w przybliżeniu normalny ze średnią i wariancją . Aby uzyskać górną wartość 5%, weź jednostronną wartość krytyczną 5% dla standardowej wartości normalnej ( ) i pomnóż ją przez i dodaj . $\nu$ $\nu$ $2\nu$ $1.645$ $\sqrt{2\nu}$ $\nu$

Wyobraźmy sobie na przykład, że potrzebujemy górnej 5% wartości krytycznej dla . $\chi^2_{6744}$

Chcemy obliczyć . Dokładna odpowiedź (do cyfr znaczących) to . $1.645 \times \sqrt{2 \times 6744} + 6744 \approx 6935$ $5$ $6936.2$

Jeśli stopnie swobody są mniejsze, możemy użyć faktu, że jeśli to to . $X$ $\chi^2_\nu$ $\sqrt{2X}\dot\sim N(\sqrt{2\nu-1},1)$

Na przykład, gdybyśmy mieli df, moglibyśmy zastosować to przybliżenie. Dokładna górna 5% wartość krytyczna dla chi-kwadrat z 674 df wynosi (do 5 cyfr) . Przy takim przybliżeniu obliczymy w następujący sposób: $674$ $735.51$

Weź górną (jednostronną) 5% wartość krytyczną dla standardowej wartości normalnej (1.645), dodaj , potęguj kwadrat i podziel przez 2. W tym przypadku: $\sqrt{2\nu-1}$

$(1.645+\sqrt{2\times 674-1})^2/2 \approx 735.2$ .

Jak widzimy, jest to dość bliskie.

W przypadku znacznie mniejszych stopni swobody można zastosować transformację Wilsona-Hilferty'ego - działa ona aż do kilku stopni swobody - ale tabele powinny to obejmować. To przybliżenie jest takie, że . $(\frac{X}{\nu})^{\frac13}\dot\sim N(1-\frac{2}{9\nu},\frac{2}{9\nu})$

Glen_b - Przywróć Monikę
źródło

+1 Pomysł można ulepszyć. Wykorzystaj fakt, że ogranicza się do racjonalnej funkcji gdy drugi parametr rośnie. Na przykład obliczysz to jako . Otrzymasz , z dokładnością do trzech znaczących cyfr. Zauważ, że parametr jest małą liczbą całkowitą, co oznacza, że prawdopodobnie będzie on w tabeli i będzie dostępny bez interpolacji.

χ^{2}

$\chi^2$

F

$F$

χ^{2}

$\chi^2$ Rdf2/df1 * (-1 + 1/(1-qchisq(0.95, df1) / df2))

2.2177

$2.2177$

χ^{2}

$\chi^2$

whuber

Zakładam, że coś tu przeoczyłem - kilkakrotnie próbowałem ustalić, co masz na myśli w tym ulepszeniu w porównaniu z tym, co zrobiłem w punkcie 3 (co już traktuje to jako prostą funkcję chi-kwadrat z małą liczbą całkowitą df, jak sugerowałoby to twierdzenie Słuckiego jako df2 ). W omawianym przykładzie moje przybliżenie jest zarówno łatwiejsze do przeprowadzenia, jak i dokładniejsze (np. Ma około 57% błędu bezwzględnego). Czy ta sugestia jest lepsza przy innych wartościach dwóch df, czy może lepiej, ponieważ jest bardziej konserwatywna niż antykonserwatywna, ...

\to \infty

$\to\infty$

Glen_b -Reinstate Monica 10.04.19

... lub czy intencją jest, aby błędy obu podejść były przeciwne w kierunku (sugerując być może połączenie obu?).

Glen_b

Pamiętam, że miałem na myśli punkt 4.

Whuber

Ach, to może mieć więcej sensu. Przepraszam, że jestem gęsty. Spróbuję to jeszcze raz.

Glen_b

Co robisz, jeśli twoje stopnie swobody przekraczają koniec twoich stołów?

Odpowiedzi: