Dlaczego nie używamy rozkładu t do konstruowania przedziału ufności dla proporcji?

18

Aby obliczyć przedział ufności (CI) dla średniej z nieznanym odchyleniem standardowym populacji (sd), szacujemy odchylenie standardowe populacji, stosując rozkład t. W szczególności gdzie . Ponieważ jednak nie mamy oszacowania punktowego odchylenia standardowego populacji, szacujemy poprzez przybliżenie gdzieCI=X¯±Z95%σX¯σX¯=σnCI=X¯±t95%(se)se=sn

Natomiast w przypadku proporcji populacji, aby obliczyć CI, przybliżamy jako gdzie dostarczył iCI=p^±Z95%(se)se=p^(1p^)nnp^15n(1p^)15

Moje pytanie brzmi: dlaczego popieramy standardowy rozkład proporcji populacji?

Abhijit
źródło
1
Moja intuicja mówi, że dzieje się tak, ponieważ aby uzyskać błąd standardowy średniej, masz drugą niewiadomą , którą szacuje się na podstawie próbki, aby zakończyć obliczenia. Standardowy błąd proporcji nie obejmuje żadnych dodatkowych niewiadomych. σ
Przywróć Monikę - G. Simpson
@GavinSimpson Brzmi przekonująco. W rzeczywistości powodem, dla którego wprowadziliśmy rozkład t, jest skompensowanie wprowadzonego błędu w celu skompensowania aproksymacji odchylenia standardowego.
Abhijit,
3
Uważam to za mniej niż przekonujące częściowo, ponieważ rozkład wynika z niezależności wariancji próbki i średniej próbki w próbkach z rozkładu normalnego, podczas gdy dla próbek z rozkładu dwumianowego dwie wielkości nie są niezależne. t
whuber
@Abhijit Niektóre podręczniki używają rozkładu t jako przybliżenia dla tej statystyki (pod pewnymi warunkami) - wydaje się, że używają n-1 jako df. Chociaż czekam na dobry formalny argument za tym, zbliżenie wydaje się często działać całkiem dobrze; dla przypadków, które sprawdziłem, jest to zwykle nieco lepsze niż normalne przybliżenie (ale do tego istnieje solidny argument asymptotyczny, którego brakuje przybliżeniu t). [Edytuj: moje własne czeki były mniej więcej podobne do tych gorących programów; różnica między z i t jest znacznie mniejsza niż ich rozbieżność w statystyce]
Glen_b -Reinstate Monica
1
Być może istnieje jakiś argument (być może oparty na przykład na wczesnych warunkach rozszerzenia serii), który mógłby ustalić, że prawie zawsze należy oczekiwać, że t będzie lepszy, lub może powinien być lepszy w określonych warunkach, ale ja nie widziałem żadnego takiego argumentu. Osobiście ogólnie trzymam się Z, ale nie martwię się, jeśli ktoś użyje t.
Glen_b

Odpowiedzi:

20

Zarówno standardowy rozkład normalny, jak i rozkład t Studenta są raczej słabymi przybliżeniami rozkładu

Z=p^pp^(1p^)/n

dla małego n, tak słabego, że błąd zmniejsza różnice między tymi dwoma rozkładami.

O to porównanie trzech rozkładzie (z pominięciem przypadki P lub 1 - p są równe zero, w których stosunek jest nieokreślona) dla n = 10 , p = 1 / 2 :p^1p^n=10,p=1/2:

Figure 1

"Empiryczną" dystrybucyjna jest Z, która musi być dyskretna ponieważ szacuje P są ograniczone do skończonego zbioru { 0 , 1 / n , 2 / n , ... , n / N } .p^{0,1/n,2/n,,n/n}.

t dystrybucja wydaje się zrobić lepszą pracę zbliżenia.

Dla n=30 oraz p=1/2, można zauważyć różnicę pomiędzy rozkładu normalnego i t Studenta rozkładu jest całkowicie pomijalne:

Figure 2

Ponieważ rozkład t Studenta jest bardziej skomplikowany niż standardowa Normalna (to tak naprawdę cała rodzina rozkładów indeksowana według „stopni swobody”, poprzednio wymagających całych rozdziałów tabel, a nie pojedynczej strony), standardowa Normalna jest używana dla prawie wszystkich przybliżenia.

Whuber
źródło
2
Odpowiedź jakościowa. +1
Demetri Pananos
10

Uzasadnienie zastosowania rozkładu t w przedziale ufności dla średniej opiera się na założeniu, że podstawowe dane są zgodne z rozkładem normalnym, co prowadzi do rozkładu chi-kwadrat przy szacowaniu odchylenia standardowego, a zatem x¯μs/ntn1. Jest to dokładny wynik przy założeniu, że dane są dokładnie normalne, co prowadzi do przedziałów ufności z dokładnie 95% pokryciem przy zastosowaniut, i mniej niż 95% pokryciem przy zastosowaniuz.

W przypadku odstępach Wald proporcje, można dostać tylko asymptotycznej normalności dla p - pp^pp^(1p^)/n, gdy n jest wystarczająco duże, co zależy od s. Rzeczywiste prawdopodobieństwo pokrycia procedury, ponieważ leżące u podstaw liczby sukcesów są dyskretne, jest czasami niższe, a czasem wyższe niż nominalne prawdopodobieństwo pokrycia 95% w zależności od nieznanegop. Tak więc nie ma teoretycznego uzasadnienia dla użyciat, i nie ma gwarancji, że z praktycznego punktu widzenia użyciettylko w celu poszerzenia przedziałów faktycznie pomogłoby osiągnąć nominalny zasięg 95%.

Prawdopodobieństwo pokrycia można dokładnie obliczyć, choć jego symulacja jest dość prosta. Poniższy przykład pokazuje symulowane prawdopodobieństwo pokrycia, gdy n = 35. Pokazuje to, że prawdopodobieństwo pokrycia przy użyciu przedziału z jest na ogół nieco mniejsze niż 0,95, podczas gdy prawdopodobieństwo pokrycia dla przedziału t może być ogólnie nieco mniejsze średnio 0,95, w zależności od twoich wcześniejszych przekonań na temat prawdopodobnych wartości p .

enter image description here

enter image description here

jsk
źródło
3
+1 Są to doskonałe ilustracje stwierdzeń, które poczyniłem (opartych jedynie na sprawdzaniu wykresów CDF, a nie rygorystycznych demonstracji) na temat względnej dokładności t Studenta i normalnych CI.
whuber
6

Zarówno AdamO, jak i jsk dają świetną odpowiedź.

Chciałbym powtórzyć ich uwagi zwykłym angielskim:

Kiedy rozkład podstawowy jest normalny, wiesz, że istnieją dwa parametry: średnia i wariancja . Rozkład T oferuje sposób wnioskowania na podstawie średniej bez znajomości dokładnej wartości wariancji. Zamiast użycia rzeczywistych wariancji, tylko przykładowe środki i przykładowe wariancje są potrzebne. Ponieważ jest to dokładna dystrybucja, wiesz dokładnie, co otrzymujesz. Innymi słowy, prawdopodobieństwo pokrycia jest prawidłowe. Użycie t po prostu odzwierciedla chęć obejścia nieznanej wariancji populacyjnej.

Kiedy jednak wnioskujemy na podstawie proporcji, rozkład leżący u podstaw jest dwumianowy. Aby uzyskać dokładny rozkład, musisz spojrzeć na przedziały ufności Cloppera-Pearsona. Podana formuła jest formułą przedziału ufności Walda. Wykorzystuje rozkład normalny do przybliżenia rozkładu dwumianowego, ponieważ rozkład normalny jest rozkładem granicznym rozkładu dwumianowego. W tym przypadku, ponieważ jest to tylko przybliżenie, dodatkowy poziom precyzji przy użyciu statystyki t staje się zbędny, wszystko sprowadza się do wydajności empirycznej. Jak sugeruje odpowiedź BruceET, Agresti-Coull jest obecnie prostą i standardową formułą pozwalającą na takie zbliżenie.

Mój profesor dr Longnecker z Teksasu A&M wykonał prostą symulację, aby zilustrować działanie różnych aproksymacji w porównaniu do CI opartego na dwumianowym.

Comparison of Various 95% C.I.’s for Proportion

Więcej informacji można znaleźć w artykule Oszacowanie przedziału dla dwumianowej proporcji w nauce , tom. 16, str. 101–133 przez L. Browna, T. Cai i A. DasGupta. Zasadniczo zaleca się AC CI dla n> = 40.

enter image description here

Qilin Wang
źródło
3

X1,X2,XnμσH0:μ=μ0Ha:μμ0Z=X¯μ0σ/n.GdyH0jest prawdziwe,ZNorm(0,1),więc odrzucamyH0na poziomie 5%, jeśli|Z|1.96.

Następnie „odwracając test”, mówimy, że 95% CI dla μ składa się z wartości μ0 , które nie prowadzą do odrzucenia - „wiarygodne” wartości μ.CI ma postać X¯±1.96σ/n,gdzie±1.96prawdopodobieństwo odcięcia 0,025 odpowiednio od górnej i dolnej części ogona standardowego rozkładu normalnego.

Jeżeli odchylenie standardowe populacji σ jest nieznane i oszacowane przez próbne odchylenie standardowe S, wówczas używamy statystyki T=X¯μ0S/n.TnSσ.

TT(ν=n1),n1σX¯±tS/n,±tT(n1).

n>30,t21.96.Sσσn>30,

Xnp^=X/np.H0:p=p0Ha:pp>0,Z=p^p0p0(1p0)/n. Under H0, we know that ZaprxNorm(0,1). So we reject H0 if |Z|1.96.

If we seek to invert this test to get a 95% CI for p, we run into some difficulties. The 'easy' way to invert the test is to start by writing p^±1.96p(1p)n. But his is useless because the value of p under the square root is unknown. The traditional Wald CI assumes that, for sufficiently large n, it is OK to substitute p^ for unknown p. Thus the Wald CI is of the form p^±1.96p^(1p^)n. [Unfortunately, the Wald interval works well only if the number of trials n is at least several hundred.]

More carefully, one can solve a somewhat messy quadratic inequality to 'invert the test'. The result is the Wilson interval. (See Wikipedia.) For a 95% confidence interval a somewhat simplified version of this result comes from defining nˇ=n+4 and pˇ=(X+2)/nˇ and then computing the interval as pˇ±1.96pˇ(1pˇ)nˇ. This style of binomial confidence interval is widely known as the Agresti-Coull interval; it has been widely advocated in elementary textbooks for about the last 20 years.

In summary, one way to look at your question is that CIs for normal μ and binomial p can be viewed as inversions of tests.

(a) The t distribution provides an exact solution to the problem of needing to use S for σ when σ is unknown.

(b) Using p^ for p requires some care because the mean and variance of p^ both depend on p. The Agresti-Coull CI provides one serviceable way to get CIs for binomial p that are reasonably accurate even for moderately small n.

BruceET
źródło
2

Note your use of the σ notation which means the (known) population standard deviation.

The T-distribution arose as an answer to the question: what happens when you don't know σ?

He noted that, when you cheat by estimating σ from the sample as a plug-in estimator, your CIs are on average too narrow. This necessitated the T-distribution.

Conversely, if you use the T distribution when you actually do know σ, your confidence intervals will on average be too wide.

Also, it should be noted that this question mirrors the answer solicited by this question.

AdamO
źródło
2
The pseudonym Gosset published under was "Student" not "Student-T". He also didn't actually come up with the standard t-distribution itself, nor was the statistic he dealt with actually the t-statistic (he did equivalent things, essentially dealing with a scaled t, but almost all the formalism we have now comes from Fisher's work). Fisher wrote the statistic the way we write it. Fisher called it the t. Fisher formally derived the distribution of the statistic (showing Gosset's combination of algebra, intuition and accompanying simulation-argument about his version of the statistic was correct)
Glen_b -Reinstate Monica
1
See Gosset's 1908 paper here: archive.org/details/biometrika619081909pear/page/n13 - there's also a nice readable pdf of the paper redone in LaTeX here. Note that this is out of copyright since it comes more than a few years before Steamboat Willie.
Glen_b -Reinstate Monica
@Glen_b Thanks! I deleted the apparently wrong anecdotes to history.
AdamO