Kiedy przeprowadzamy testy, uzyskujemy dwa wyniki.
1) Odrzucamy hipotezę zerową
2) Nie odrzucamy hipotezy zerowej.
Nie mówimy o akceptowaniu alternatywnych hipotez. Jeśli nie mówimy o akceptacji alternatywnej hipotezy, dlaczego w ogóle potrzebujemy alternatywnej hipotezy?
Oto aktualizacja: czy ktoś mógłby mi podać dwa przykłady:
1) odrzucenie hipotezy zerowej jest równoznaczne z zaakceptowaniem hipotezy alternatywnej
2) odrzucenie hipotezy zerowej nie jest równoznaczne z zaakceptowaniem hipotezy alternatywnej
hypothesis-testing
użytkownik1700890
źródło
źródło
Odpowiedzi:
Skupię się na: „Jeśli nie mówimy o akceptowaniu alternatywnej hipotezy, dlaczego w ogóle potrzebujemy alternatywnej hipotezy?”
Ponieważ pomaga nam wybrać znaczącą statystykę testową i zaprojektować nasze badanie tak, aby miało dużą moc - dużą szansę na odrzucenie wartości zerowej, gdy alternatywa jest prawdziwa. Bez alternatywy nie mamy pojęcia władzy.
Wyobraź sobie, że mamy tylko hipotezę zerową i nie ma alternatywy. Wtedy nie ma wskazówek, jak wybrać statystykę testową, która będzie miała wysoką moc. Wszystko, co możemy powiedzieć, to: „Odrzuć wartość zerową za każdym razem, gdy zobaczysz statystykę testową, której wartość jest mało prawdopodobna pod wartością zerową”. Możemy wybrać coś arbitralnego: możemy narysować liczby losowe Uniform (0,1) i odrzucić zero, gdy są poniżej 0,05. Dzieje się tak pod zerowym „rzadko”, nie więcej niż 5% czasu - jednak równie rzadko zdarza się, gdy zerowy jest fałszywy. Jest to więc technicznie test statystyczny, ale nie ma żadnego znaczenia jako dowód za lub przeciw czegokolwiek.
Zamiast tego, zwykle mamy jakieś naukowo-wiarygodną hipotezę alternatywną ( „Nie jest dodatnia różnica w wynikach między grupami leczonymi i kontrolnymi w moim eksperymencie”). Chcielibyśmy bronić go przed potencjalnymi krytykami, którzy postawiliby hipotezę zerową jako adwokaci diabła („Nie jestem jeszcze przekonany - może twoje leczenie faktycznie boli lub w ogóle nie ma żadnego efektu , a także jakąkolwiek widoczną różnicę w dane wynikają wyłącznie z wariantu próbkowania ”).
Mając na uwadze te 2 hipotezy, możemy teraz skonfigurować potężny test, wybierając statystykę testową, której typowe wartości w ramach alternatywy są mało prawdopodobne w przypadku wartości zerowej. (Dodatnia statystyka t dla dwóch prób daleko od zera byłaby nie zaskakująca, jeśli alternatywa jest prawdziwa, ale zaskakująca, jeśli zerowa jest prawdziwa.) Następnie obliczamy rozkład próbkowania statystyki testowej pod zerowym, abyśmy mogli obliczyć wartości p --- i interpretuj je. Kiedy obserwujemy statystykę testową, która jest mało prawdopodobna poniżej zera, zwłaszcza jeśli projekt badania, wielkość próby itp. Zostały wybrane, aby mieć dużą moc , daje to pewne dowody na alternatywę.
Dlaczego więc nie mówimy o „akceptowaniu” alternatywnej hipotezy? Ponieważ nawet badanie o dużej mocy nie zapewnia całkowicie rygorystycznego dowodu, że wartość zerowa jest błędna. To wciąż rodzaj dowodów, ale słabszy niż niektóre inne dowody.
źródło
Historycznie nie było zgody co do tego, czy konieczna jest alternatywna hipoteza. Pozwólcie, że wyjaśnię ten punkt niezgody, rozważając opinie Fishera i Neymana w kontekście statystyk częstych oraz odpowiedź bayesowską.
Fisher - Nie potrzebujemy alternatywnej hipotezy; możemy po prostu przetestować hipotezę zerową za pomocą testu dobroci dopasowania. Wynikiem jest wartość , która stanowi miarę dowodu dla hipotezy zerowej.p
Neyman - Musimy wykonać test hipotezy między wartością zerową a alternatywną. Test jest taki, że spowodowałby błędy typu 1 ze stałą, z góry określoną częstotliwością . Rezultatem jest decyzja - odrzucić lub nie odrzucić hipotezy zerowej na poziomie .α α
Potrzebujemy alternatywy z teoretycznego punktu widzenia decyzji - dokonujemy wyboru między dwoma kierunkami działania - i ponieważ powinniśmy zgłosić moc testu Powinniśmy szukać najbardziej wydajnych testów, aby mieć jak największą szansę na odrzucenie gdy alternatywa jest prawdziwa.1−p(Accept H0|H1) H0
Aby spełnić oba te punkty, hipotezą alternatywną nie może być niejasna hipoteza „nie ”.H0
Bayesian - Musimy rozważyć co najmniej dwa modele i zaktualizować ich względną wiarygodność danymi. Dzięki tylko jednemu modelowi po prostu mamy bez względu na to, jakie dane gromadzimy. Aby dokonać obliczeń w tych ramach, alternatywną hipotezą (lub modelem, jak by to było znane w tym kontekście) nie może być źle zdefiniowana hipoteza „nie ”. Nazywam to źle zdefiniowanym, ponieważ nie możemy napisać modelu .p(H0)=1 H0 p(data|not H0)
źródło
Nie jestem w 100% pewien, czy jest to wymóg formalny, ale zazwyczaj hipoteza zerowa i hipoteza alternatywna są: 1) komplementarne i 2) wyczerpujące. To znaczy: 1) nie mogą być jednocześnie prawdziwe; 2) jeśli jedno nie jest prawdziwe, drugie musi być prawdziwe.
Rozważ prosty test wysokości między dziewczętami i chłopcami. Typowa hipoteza zerowa w tym przypadku jest taka, że . Alternatywną hipotezą byłby . Więc jeśli wartość null nie jest prawdziwa - alternatywa musi być prawdziwa.heightboys=heightgirls heightboys≠heightgirls
źródło
W klasycznym teście hipotezy jedyną matematyczną rolą odgrywaną przez hipotezę alternatywną jest to, że wpływa ona na porządkowanie dowodów za pomocą wybranej statystyki testu. Hipoteza alternatywna służy do ustalenia odpowiedniej statystyki testu dla testu, która jest równoważna z ustaleniem porządkowego uporządkowania wszystkich możliwych wyników danych od tych najbardziej sprzyjających hipotezie zerowej (względem podanej alternatywy) do tych najmniej sprzyjających hipotezom zerowym (w stosunku do podanej alternatywy). Po utworzeniu tego porządkowego rankingu możliwych wyników danych, hipoteza alternatywna nie odgrywa już żadnej roli matematycznej w teście .
Wyjaśnienie formalne: w dowolnym klasycznym teście hipotez z obserwowalnymi wartościami danych masz pewną statystykę testową który odwzorowuje każdy możliwy wynik danych na skalę porządkową, która mierzy, czy bardziej sprzyja hipotezie zerowej lub alternatywnej. (Bez utraty ogólności założymy, że niższe wartości bardziej sprzyjają hipotezie zerowej, a wyższe wartości bardziej sprzyjają hipotezie alternatywnej. Czasami mówimy, że wyższe wartości statystyki testowej są „bardziej ekstremalne”, o ile stanowią bardziej ekstremalne dowód na alternatywną hipotezę.) Wartość p testu jest następnie podawana przez:n x=(x1,...,xn) T:Rn→R
Ta funkcja wartości p w pełni określa dowody w teście dla dowolnego wektora danych. W połączeniu z wybranym poziomem istotności określa wynik testu dla dowolnego wektora danych. (Opisaliśmy to dla stałej liczby punktów danych ale można to łatwo rozszerzyć, aby pozwolić na dowolne .) Ważne jest, aby pamiętać, że na wartość p wpływa statystyka testowa tylko w skali porządkowej, którą indukujen n , więc jeśli zastosujesz monotonicznie rosnącą transformację do statystyki testu, nie ma to znaczenia dla testu hipotez (tj. jest to ten sam test). Ta właściwość matematyczna odzwierciedla jedynie fakt, że jedynym celem statystyki testowej jest wywołanie skali porządkowej na przestrzeni wszystkich możliwych wektorów danych, aby pokazać, które są bardziej sprzyjające zeru / alternatywie.
Alternatywna hipoteza wpływa na ten pomiar tylko poprzez funkcjęT , która jest wybierana na podstawie podanej zerowej i alternatywnej hipotezy w ramach całego modelu. Dlatego możemy uznać funkcję statystyki testowej za funkcję modelu ogólnego i dwie hipotezy. Na przykład w przypadku testu stosunku prawdopodobieństwa statystyka testowa jest tworzona przez przyjęcie stosunku (lub logarytmu stosunku) supremum funkcji prawdopodobieństwa w zakresach parametrów odnoszących się do hipotez zerowych i alternatywnych.T≡g(M,H0,HA) M
Co to oznacza, jeśli porównamy testy z różnymi alternatywami? Załóżmy, że masz ustalony model i chcesz wykonać dwa różne testy hipotez, porównując tę samą hipotezę zerową z dwiema różnymi alternatywami i . W takim przypadku będziesz mieć dwie różne funkcje statystyki testowej:M H0 HA H′A
prowadzące do odpowiednich funkcji wartości p:
Należy zauważyć, że jeśli i są monotonicznymi rosnącymi transformacjami względem siebie, to funkcje wartości i są identyczne, więc oba testy są tym samym testem. Jeśli funkcje i nie są monotonicznymi transformacjami rosnącymi względem siebie, mamy dwa naprawdę różne testy hipotez.T T′ p p′ T T′
źródło
Powodem, dla którego nie chciałbym zaakceptować alternatywnej hipotezy, jest to, że nie tego testujemy. Test istotności hipotezy zerowej (NHST) oblicza prawdopodobieństwo zaobserwowania danych tak ekstremalnie, jak zaobserwowano (lub więcej), biorąc pod uwagę, że hipoteza zerowa jest prawdziwa, lub innymi słowy NHST oblicza wartość prawdopodobieństwa, która jest uwarunkowana faktem, że hipoteza zerowa jest prawdziwa , . Jest to więc prawdopodobieństwo danych przy założeniu, że hipoteza zerowa jest prawdziwa. Nigdy nie wykorzystuje ani nie podaje prawdopodobieństwa hipotezy (ani zerowej, ani alternatywnej). Dlatego gdy obserwujesz małą wartość p, wiesz tylko, że zaobserwowane dane wydają się mało prawdopodobne wP(data|H0) H0 , więc zbieracie dowody przeciwko zeru i na korzyść jakiegokolwiek alternatywnego wyjaśnienia.
Przed uruchomieniem eksperymentu możesz zdecydować o poziomie odcięcia ( ), który uważa, że masz znaczący wynik, co oznacza, że jeśli twoja wartość p spadnie poniżej tego poziomu, wyciągniesz wniosek, że dowody na wartość zerową są tak przeważnie wysokie, że dane musiały pochodzić z innego procesu generowania danych i odrzucasz hipotezę zerową opartą na tych dowodach. Jeśli wartość p jest powyżej tego poziomu, nie odrzucasz hipotezy zerowej, ponieważ twoje dowody nie są wystarczająco istotne, aby sądzić, że twoja próbka pochodzi z innego procesu generowania danych.α
Powodem, dla którego formułujesz alternatywną hipotezę, jest to, że prawdopodobnie miałeś na myśli eksperyment przed rozpoczęciem próbkowania. Sformułowanie alternatywnej hipotezy może również decydować o tym, czy zastosujesz test jednostronny czy dwustronny, a tym samym dać większą moc statystyczną (w scenariuszu jednostronnym). Ale technicznie rzecz biorąc, aby uruchomić test, nie trzeba formułować alternatywnej hipotezy, wystarczy dane.
źródło