Czy możemy odrzucić hipotezę zerową z przedziałami ufności uzyskanymi za pomocą próbkowania zamiast hipotezy zerowej?

9

Nauczono mnie, że możemy uzyskać oszacowanie parametru w postaci przedziału ufności po pobraniu próbki z populacji. Na przykład 95% przedziały ufności, bez naruszonych założeń, powinny mieć 95% wskaźnik sukcesu zawierający dowolny prawdziwy parametr, który oceniamy w populacji.

To znaczy,

Utwórz oszacowanie punktowe z próbki.
Utwórz zakres wartości, które teoretycznie mają 95% szansy na zawarcie prawdziwej wartości, którą próbujemy oszacować.

Jednak gdy temat przeszedł do testowania hipotez, kroki opisano poniżej:

Załóżmy, że jakiś parametr jest hipotezą zerową.
Opracuj rozkład prawdopodobieństwa prawdopodobieństwa otrzymania różnych oszacowań punktowych, biorąc pod uwagę, że ta hipoteza zerowa jest prawdziwa.
Odrzuć hipotezę zerową, jeśli uzyskany szacunek punktowy zostanie wygenerowany mniej niż 5% czasu, jeśli hipoteza zerowa jest prawdziwa.

Moje pytanie brzmi:

Czy konieczne jest tworzenie przedziałów ufności przy użyciu hipotezy zerowej, aby odrzucić zerową? Dlaczego po prostu nie wykonać pierwszej procedury i uzyskać oszacowanie dla prawdziwego parametru (nie używając naszej hipotetycznej wartości do obliczenia przedziału ufności), a następnie odrzucić hipotezę zerową, jeśli nie mieści się w tym przedziale?

Wydaje mi się to logicznie równoważne intuicyjnie, ale obawiam się, że brakuje mi czegoś bardzo fundamentalnego, ponieważ prawdopodobnie istnieje powód, dla którego uczy się go w ten sposób.

hypothesis-testing confidence-interval estimation inference Nikli
źródło

Przepraszam, że jestem niejasny, Martijn. Wkrótce dokonam edycji mojego postu, aby było łatwiej dla osób szukających w przyszłości tych samych pytań. Miałem na myśli to, że możemy obliczyć oszacowanie parametru z próbki lub możemy obliczyć zakres oszacowań, które uznalibyśmy za poparcie hipotezy zerowej przy użyciu hipotezy zerowej. Nie rozumiałem, dlaczego konieczne było użycie wartości null, aby sprawdzić, czy nasze oszacowanie punktowe mieści się w tym przedziale, zamiast po prostu użycia naszego oszacowania parametru i sprawdzenia, czy wartość null mieści się w granicach oszacowania parametru. Mam nadzieję, że to ma sens!

Nikli

Ciekawym eksperymentem myślowym jest próba sprzedania ci ważonych kości. Rzucają je, a następnie stwierdzają, że są ważone w kierunku, w którym obserwujesz (np. 6 pojawia się w 20% przypadków). Czy są ważone (o ile wykonano wystarczającą liczbę rzutów próbnych) io ile warto wykonać własne (dodatkowe) testy rzutów? Sprzedawca i kupujący mają różne cele ...

Philip Oakley

5

Prostym problemem jest przykładowo badanie średniej populacji normalnej ze znaną wariancją . Następnie oś przestawna - wielkość, której rozkład nie zależy od parametru, podaje . Wartości krytyczne spełniają, w tym symetrycznym przypadku, i . $\sigma^2=1$ $\bar{Y}-\mu\sim N(0,1/n)$ $z_{\alpha/2}$ $\Phi(-z_{\alpha/2})=\alpha/2$ $\Phi(z_{\alpha/2})=1-\alpha/2$

Stąd , aby to przedział ufności na poziomie .

\begin{array}{rcl} 1 - α & = & Pr {(\bar{X} - μ) / (1 / \sqrt{n}) \in (- z_{α / 2}, z_{α / 2})} \\ = & Pr {- z_{α / 2} ⩽ (\bar{X} - μ) \sqrt{n} ⩽ z_{α / 2}} \\ = & Pr {z_{α / 2} ⩾ (μ - \bar{X}) \sqrt{n} ⩾ - z_{α / 2}} \\ = & Pr {- z_{α / 2} / \sqrt{n} ⩽ μ - \bar{X} ⩽ z_{α / 2} / \sqrt{n}} \\ = & Pr {\bar{X} - z_{α / 2} / \sqrt{n} ⩽ μ ⩽ \bar{X} + z_{α / 2} / \sqrt{n}} \\ = & Pr {(\bar{X} - z_{α / 2} / \sqrt{n}, \bar{X} + z_{α / 2} / \sqrt{n}) ∋ μ} \end{array}

$\begin{eqnarray*} 1-\alpha&=&\Pr\{(\bar{X}-\mu)/(1/\sqrt{n})\in(-z_{\alpha/2},z_{\alpha/2})\}\\ &=&\Pr\{-z_{\alpha/2}\leqslant(\bar{X}-\mu)\sqrt{n}\leqslant z_{\alpha/2}\}\\ &=&\Pr\{z_{\alpha/2}\geqslant(\mu-\bar{X})\sqrt{n}\geqslant -z_{\alpha/2}\}\\ &=&\Pr\{-z_{\alpha/2}/\sqrt{n}\leqslant\mu-\bar{X}\leqslant z_{\alpha/2}/\sqrt{n}\}\\ &=&\Pr\{\bar{X}-z_{\alpha/2}/\sqrt{n}\leqslant\mu\leqslant \bar{X}+z_{\alpha/2}/\sqrt{n}\}\\ &=&\Pr\{(\bar{X}-z_{\alpha/2}/\sqrt{n},\bar{X}+z_{\alpha/2}/\sqrt{n})\ni\mu\} \end{eqnarray*}$

(\bar{X} - z_{α / 2} / \sqrt{n}, \bar{X} + z_{α / 2} / \sqrt{n})

$(\bar{X}-z_{\alpha/2}/\sqrt{n},\bar{X}+z_{\alpha/2}/\sqrt{n})$

1 - α

$1-\alpha$

Jednocześnie zdarzenie w pierwszym wierszu wyświetlacza jest dokładnie zdarzeniem, w którym hipoteza zerowa nie jest odrzucana dla tego . Ponieważ reszta zawiera po prostu równoważne przeformułowania, ci rzeczywiście zawiera wszystko dla którego wartość null nie jest odrzucana, i nie jest potrzebne odniesienie do „pod null”. $\mu$ $\mu$

Oto fabuła analogiczna do wizualizacji +1 Martijna, której celem jest pokazanie dualności między przedziałami ufności a testami. oznacza przedział ufności należący do niektórych a region akceptacji należący do jakiejś hipotezy . $C$ $\bar{x}^*$ $A(\mu_0)$ $\mu=\mu_0$

Christoph Hanck
źródło

10

Tak, możesz zastąpić test hipotez (porównanie próbki z hipotetycznym rozkładem wyników testu) przez porównanie z przedziałem ufności obliczonym z próbki. Ale pośrednio przedział ufności jest już swego rodzaju testem hipotez, a mianowicie:

Przedziały ufności mogą być konstruowane jako zakres wartości, dla których test hipotezy na poziomie zakończy się sukcesem, $\alpha$ a poza zakresem test hipotezy na poziomie zakończy się niepowodzeniem. $\alpha$

Konsekwencją takiego zakresu jest to, że zakres zawodzi tylko ułamek czasu. $\alpha$

Przykład

Korzystam z obrazu z odpowiedzi na poniższe pytanie: Przedziały ufności: jak formalnie poradzić sobie z $P(L(\textbf{X}) \leq \theta, U(\textbf{X})\geq\theta) = 1-\alpha$

Jest to odmiana wykresu z Clopper-Pearson . Wyobraź sobie sprawę 100 próbach Bernoulliego gdzie prawdopodobieństwo sukcesu jest i obserwujemy całkowitą liczbę sukcesów . $\theta$ $X$

Uwaga:

W kierunku pionowym widać testowanie hipotez. Np. Dla danej hipotetycznej wartości odrzucasz hipotezę, jeśli zmierzony znajduje się powyżej lub poniżej czerwonych lub zielonych kropkowanych linii. $\theta$ $X$
W kierunku poziomym widać przedziały ufności Cloppera-Pearsona. Jeśli dla jakiejkolwiek obserwacji X użyjesz tych przedziałów ufności, pomylisz się tylko w 5% przypadków

(ponieważ będziesz obserwował tylko taki X, na którym opierasz „zły” interwał, 5% czasu)

Sextus Empiricus
źródło

Czy możemy odrzucić hipotezę zerową z przedziałami ufności uzyskanymi za pomocą próbkowania zamiast hipotezy zerowej?

Odpowiedzi: