Nauczono mnie, że możemy uzyskać oszacowanie parametru w postaci przedziału ufności po pobraniu próbki z populacji. Na przykład 95% przedziały ufności, bez naruszonych założeń, powinny mieć 95% wskaźnik sukcesu zawierający dowolny prawdziwy parametr, który oceniamy w populacji.
To znaczy,
- Utwórz oszacowanie punktowe z próbki.
- Utwórz zakres wartości, które teoretycznie mają 95% szansy na zawarcie prawdziwej wartości, którą próbujemy oszacować.
Jednak gdy temat przeszedł do testowania hipotez, kroki opisano poniżej:
- Załóżmy, że jakiś parametr jest hipotezą zerową.
- Opracuj rozkład prawdopodobieństwa prawdopodobieństwa otrzymania różnych oszacowań punktowych, biorąc pod uwagę, że ta hipoteza zerowa jest prawdziwa.
- Odrzuć hipotezę zerową, jeśli uzyskany szacunek punktowy zostanie wygenerowany mniej niż 5% czasu, jeśli hipoteza zerowa jest prawdziwa.
Moje pytanie brzmi:
Czy konieczne jest tworzenie przedziałów ufności przy użyciu hipotezy zerowej, aby odrzucić zerową? Dlaczego po prostu nie wykonać pierwszej procedury i uzyskać oszacowanie dla prawdziwego parametru (nie używając naszej hipotetycznej wartości do obliczenia przedziału ufności), a następnie odrzucić hipotezę zerową, jeśli nie mieści się w tym przedziale?
Wydaje mi się to logicznie równoważne intuicyjnie, ale obawiam się, że brakuje mi czegoś bardzo fundamentalnego, ponieważ prawdopodobnie istnieje powód, dla którego uczy się go w ten sposób.
Odpowiedzi:
Prostym problemem jest przykładowo badanie średniej populacji normalnej ze znaną wariancją . Następnie oś przestawna - wielkość, której rozkład nie zależy od parametru, podaje . Wartości krytyczne spełniają, w tym symetrycznym przypadku, i .σ2=1 Y¯−μ∼N(0,1/n) zα/2 Φ(−zα/2)=α/2 Φ(zα/2)=1−α/2
Stąd , aby to przedział ufności na poziomie .
Jednocześnie zdarzenie w pierwszym wierszu wyświetlacza jest dokładnie zdarzeniem, w którym hipoteza zerowa nie jest odrzucana dla tego . Ponieważ reszta zawiera po prostu równoważne przeformułowania, ci rzeczywiście zawiera wszystko dla którego wartość null nie jest odrzucana, i nie jest potrzebne odniesienie do „pod null”.μ μ
Oto fabuła analogiczna do wizualizacji +1 Martijna, której celem jest pokazanie dualności między przedziałami ufności a testami. oznacza przedział ufności należący do niektórych a region akceptacji należący do jakiejś hipotezy .C x¯∗ A(μ0) μ=μ0
źródło
Tak, możesz zastąpić test hipotez (porównanie próbki z hipotetycznym rozkładem wyników testu) przez porównanie z przedziałem ufności obliczonym z próbki. Ale pośrednio przedział ufności jest już swego rodzaju testem hipotez, a mianowicie:
Konsekwencją takiego zakresu jest to, że zakres zawodzi tylko ułamek czasu.α
Przykład
Korzystam z obrazu z odpowiedzi na poniższe pytanie: Przedziały ufności: jak formalnie poradzić sobie zP(L(X)≤θ,U(X)≥θ)=1−α
Jest to odmiana wykresu z Clopper-Pearson . Wyobraź sobie sprawę 100 próbach Bernoulliego gdzie prawdopodobieństwo sukcesu jest i obserwujemy całkowitą liczbę sukcesów .θ X
Uwaga:
W kierunku pionowym widać testowanie hipotez. Np. Dla danej hipotetycznej wartości odrzucasz hipotezę, jeśli zmierzony znajduje się powyżej lub poniżej czerwonych lub zielonych kropkowanych linii.θ X
W kierunku poziomym widać przedziały ufności Cloppera-Pearsona. Jeśli dla jakiejkolwiek obserwacji X użyjesz tych przedziałów ufności, pomylisz się tylko w 5% przypadków
(ponieważ będziesz obserwował tylko taki X, na którym opierasz „zły” interwał, 5% czasu)
źródło