Dlaczego potrzebujemy alternatywnej hipotezy?

14

Kiedy przeprowadzamy testy, uzyskujemy dwa wyniki.

1) Odrzucamy hipotezę zerową

2) Nie odrzucamy hipotezy zerowej.

Nie mówimy o akceptowaniu alternatywnych hipotez. Jeśli nie mówimy o akceptacji alternatywnej hipotezy, dlaczego w ogóle potrzebujemy alternatywnej hipotezy?

Oto aktualizacja: czy ktoś mógłby mi podać dwa przykłady:

1) odrzucenie hipotezy zerowej jest równoznaczne z zaakceptowaniem hipotezy alternatywnej

2) odrzucenie hipotezy zerowej nie jest równoznaczne z zaakceptowaniem hipotezy alternatywnej

użytkownik1700890
źródło
1
Ponieważ próbujesz wyciągnąć pewne wnioski. Jeśli nie jest to hipoteza zerowa, być może jest to hipoteza alternatywna (nawet jeśli nie jesteś całkowicie pewien, czy hipoteza alternatywna jest prawidłowa, jeśli odrzucisz hipotezę zerową). Odrzucając hipotezę zerową, mówisz, że masz jakieś „dowody”, aby dojść do wniosku, że hipoteza alternatywna może być prawdziwa.
nbro
@nbro, dziękuję, dodałem pytanie do mojego oryginalnego postu. Czy mógłbyś rzucić okiem?
user1700890,
1
Ogólnie rzecz biorąc, nie znam się na testowaniu hipotez. Lepiej zaczekaj, aż bardziej kompetentna osoba odpowie na twoje pytania.
nbro
Jeśli twoja alternatywna hipoteza jest uzupełnieniem hipotezy zerowej, nie ma sensu jej używać. Nikt nie stosuje alternatywnej hipotezy w praktyce z tego powodu poza podręcznikami.
Aksakal
„Nie mówimy o akceptowaniu alternatywnych hipotez” - nieprawda w przypadku wszystkich możliwych „my”. Niektóre osoby mówią o przyjęciu alternatywnej hipotezy, a wielu innych tak uważa , nawet jeśli szanują tabu , aby to nie powiedzieć . Dość pedantyczne jest unikanie mówienia o przyjęciu alternatywnej hipotezy, gdy nie ma uzasadnionych wątpliwości, że jest ona prawdziwa. Ponieważ jednak statystyki są tak podatne na niewłaściwe użycie, pedanteria jest prawdopodobnie dobrą rzeczą, ponieważ wprowadza ostrożność w interpretacji wyników.
John Coleman

Odpowiedzi:

8

Skupię się na: „Jeśli nie mówimy o akceptowaniu alternatywnej hipotezy, dlaczego w ogóle potrzebujemy alternatywnej hipotezy?”

Ponieważ pomaga nam wybrać znaczącą statystykę testową i zaprojektować nasze badanie tak, aby miało dużą moc - dużą szansę na odrzucenie wartości zerowej, gdy alternatywa jest prawdziwa. Bez alternatywy nie mamy pojęcia władzy.

Wyobraź sobie, że mamy tylko hipotezę zerową i nie ma alternatywy. Wtedy nie ma wskazówek, jak wybrać statystykę testową, która będzie miała wysoką moc. Wszystko, co możemy powiedzieć, to: „Odrzuć wartość zerową za każdym razem, gdy zobaczysz statystykę testową, której wartość jest mało prawdopodobna pod wartością zerową”. Możemy wybrać coś arbitralnego: możemy narysować liczby losowe Uniform (0,1) i odrzucić zero, gdy są poniżej 0,05. Dzieje się tak pod zerowym „rzadko”, nie więcej niż 5% czasu - jednak równie rzadko zdarza się, gdy zerowy jest fałszywy. Jest to więc technicznie test statystyczny, ale nie ma żadnego znaczenia jako dowód za lub przeciw czegokolwiek.

Zamiast tego, zwykle mamy jakieś naukowo-wiarygodną hipotezę alternatywną ( „Nie jest dodatnia różnica w wynikach między grupami leczonymi i kontrolnymi w moim eksperymencie”). Chcielibyśmy bronić go przed potencjalnymi krytykami, którzy postawiliby hipotezę zerową jako adwokaci diabła („Nie jestem jeszcze przekonany - może twoje leczenie faktycznie boli lub w ogóle nie ma żadnego efektu , a także jakąkolwiek widoczną różnicę w dane wynikają wyłącznie z wariantu próbkowania ”).

Mając na uwadze te 2 hipotezy, możemy teraz skonfigurować potężny test, wybierając statystykę testową, której typowe wartości w ramach alternatywy są mało prawdopodobne w przypadku wartości zerowej. (Dodatnia statystyka t dla dwóch prób daleko od zera byłaby nie zaskakująca, jeśli alternatywa jest prawdziwa, ale zaskakująca, jeśli zerowa jest prawdziwa.) Następnie obliczamy rozkład próbkowania statystyki testowej pod zerowym, abyśmy mogli obliczyć wartości p --- i interpretuj je. Kiedy obserwujemy statystykę testową, która jest mało prawdopodobna poniżej zera, zwłaszcza jeśli projekt badania, wielkość próby itp. Zostały wybrane, aby mieć dużą moc , daje to pewne dowody na alternatywę.

Dlaczego więc nie mówimy o „akceptowaniu” alternatywnej hipotezy? Ponieważ nawet badanie o dużej mocy nie zapewnia całkowicie rygorystycznego dowodu, że wartość zerowa jest błędna. To wciąż rodzaj dowodów, ale słabszy niż niektóre inne dowody.

Civilstat
źródło
7

Historycznie nie było zgody co do tego, czy konieczna jest alternatywna hipoteza. Pozwólcie, że wyjaśnię ten punkt niezgody, rozważając opinie Fishera i Neymana w kontekście statystyk częstych oraz odpowiedź bayesowską.

  • Fisher - Nie potrzebujemy alternatywnej hipotezy; możemy po prostu przetestować hipotezę zerową za pomocą testu dobroci dopasowania. Wynikiem jest wartość , która stanowi miarę dowodu dla hipotezy zerowej.p

  • Neyman - Musimy wykonać test hipotezy między wartością zerową a alternatywną. Test jest taki, że spowodowałby błędy typu 1 ze stałą, z góry określoną częstotliwością . Rezultatem jest decyzja - odrzucić lub nie odrzucić hipotezy zerowej na poziomie .αα

    Potrzebujemy alternatywy z teoretycznego punktu widzenia decyzji - dokonujemy wyboru między dwoma kierunkami działania - i ponieważ powinniśmy zgłosić moc testu Powinniśmy szukać najbardziej wydajnych testów, aby mieć jak największą szansę na odrzucenie gdy alternatywa jest prawdziwa.

    1p(Accept H0|H1)
    H0

    Aby spełnić oba te punkty, hipotezą alternatywną nie może być niejasna hipoteza „nie ”.H0

  • Bayesian - Musimy rozważyć co najmniej dwa modele i zaktualizować ich względną wiarygodność danymi. Dzięki tylko jednemu modelowi po prostu mamy bez względu na to, jakie dane gromadzimy. Aby dokonać obliczeń w tych ramach, alternatywną hipotezą (lub modelem, jak by to było znane w tym kontekście) nie może być źle zdefiniowana hipoteza „nie ”. Nazywam to źle zdefiniowanym, ponieważ nie możemy napisać modelu .

    p(H0)=1
    H0p(data|not H0)

innisfree
źródło
1
Twój ostatni punkt jest doskonały i często pomijany w publikacjach, które opierają całą swoją argumentację na jednym, niemotywowanym NHST.
Konrad Rudolph
Dlaczego źle zdefiniowano „nie ”? H0
Michael
Co to jest? Czy możesz obliczyć ? p(data|notH0)
innisfree
@innisfree pod pojęciem częstym nie, ale prawdopodobnie pod bayesowskim.
Michael
Spróbuj tego bez wprowadzania co najmniej 2 modeli ...
innisfree
4

Nie jestem w 100% pewien, czy jest to wymóg formalny, ale zazwyczaj hipoteza zerowa i hipoteza alternatywna są: 1) komplementarne i 2) wyczerpujące. To znaczy: 1) nie mogą być jednocześnie prawdziwe; 2) jeśli jedno nie jest prawdziwe, drugie musi być prawdziwe.

Rozważ prosty test wysokości między dziewczętami i chłopcami. Typowa hipoteza zerowa w tym przypadku jest taka, że . Alternatywną hipotezą byłby . Więc jeśli wartość null nie jest prawdziwa - alternatywa musi być prawdziwa.heightboys=heightgirlsheightboysheightgirls

Karolis Koncevičius
źródło
1
Całkowicie zgadzam się z twoimi stwierdzeniami, ale należy zauważyć, że zarówno jak i są zwykle nieskończenie dużymi zestawami hipotez zerowych. Wydaje się również, że wielu jest przekonanych, że i nie muszą być wyczerpujące, np. Patrz ta lub ta dyskusja. H0HaH0Ha
bi_scholar
2
@bi_scholar dziękuję za wątki w dyskusji. Nie jestem w tym ekspertem, ale w oparciu o proste rozumowanie uważam, że muszą być wyczerpujące. Rozważ ten dziwny test: ktoś znajduje 5 skał ułożonych w kolejności na drodze. Jego : wiatr to zrobił. Jego : to byli kosmici. Teraz, jeśli przetestuje szansę, że wiatr to zrobił i znajdzie prawdopodobieństwo 0,0001 - odrzuca hipotezę wiatru. Ale to nie daje mu prawa do twierdzenia, że ​​to kosmici. Jedyne, co może twierdzić, to to, że szansa na wiatr jest niewielka. Ale WSZELKIE inne wyjaśnienia pozostają otwarte. H0H1
Karolis Koncevičius
1
Zgadzam się. Moje rozumowanie było takie, że testowanie hipotez dotyczy akceptacji lub odrzucenia podczas odrzucania lub akceptowania . Jeśli i nie są wyczerpujące, nie ma sensu w ogóle definiować żadnego , ponieważ nawet gdy odrzucimy nie możemy zaakceptować , ponieważ istnieją inne hipotezy poza i które również mogą być prawdziwe. Niestety nie udało mi się zdobyć punktu w pierwszym wątku. H0HaH0HaHaH0HaH0Ha
bi_scholar
1
@ innisfree można przetestować dwie hipotezy punktowe w jakiejś strukturze prawdopodobieństwa - jasne. Ale procedura ta nie byłaby zakładana jako „testowanie zerowej hipotezy” i jest nieprecyzyjna. Wybrałby najbliższy jako prawdziwy, nawet w przypadkach, gdy żaden z nich nie jest prawdziwy. Ponadto w odniesieniu do mocy - przy obliczaniu mocy testu można wybrać alternatywną hipotezę lub wielkość efektu, ale (moim zdaniem) należy ją zapomnieć po przeprowadzeniu testu. Chyba że są jakieś wcześniejsze informacje, które mówią mu o możliwych skutkach obecnych w danych. Na przykład białe / czarne piksele na hałaśliwym zdjęciu.
Karolis Koncevičius
1
@innisfree Jestem ciekawy, jak wyglądałby taki test, czy mógłbyś sformułować mały przykład? Jestem przekonany, że nie możemy zaakceptować , odrzucając chyba że co odpowiada i są wyczerpujące. θ=1H0θ{0,1}H0H1
bi_scholar
2

Dlaczego w ogóle potrzebujemy alternatywnej hipotezy?

W klasycznym teście hipotezy jedyną matematyczną rolą odgrywaną przez hipotezę alternatywną jest to, że wpływa ona na porządkowanie dowodów za pomocą wybranej statystyki testu. Hipoteza alternatywna służy do ustalenia odpowiedniej statystyki testu dla testu, która jest równoważna z ustaleniem porządkowego uporządkowania wszystkich możliwych wyników danych od tych najbardziej sprzyjających hipotezie zerowej (względem podanej alternatywy) do tych najmniej sprzyjających hipotezom zerowym (w stosunku do podanej alternatywy). Po utworzeniu tego porządkowego rankingu możliwych wyników danych, hipoteza alternatywna nie odgrywa już żadnej roli matematycznej w teście .


Wyjaśnienie formalne: w dowolnym klasycznym teście hipotez z obserwowalnymi wartościami danych masz pewną statystykę testową który odwzorowuje każdy możliwy wynik danych na skalę porządkową, która mierzy, czy bardziej sprzyja hipotezie zerowej lub alternatywnej. (Bez utraty ogólności założymy, że niższe wartości bardziej sprzyjają hipotezie zerowej, a wyższe wartości bardziej sprzyjają hipotezie alternatywnej. Czasami mówimy, że wyższe wartości statystyki testowej są „bardziej ekstremalne”, o ile stanowią bardziej ekstremalne dowód na alternatywną hipotezę.) Wartość p testu jest następnie podawana przez:nx=(x1,...,xn)T:RnR

p(x)pT(x)P(T(X)T(x)|H0).

Ta funkcja wartości p w pełni określa dowody w teście dla dowolnego wektora danych. W połączeniu z wybranym poziomem istotności określa wynik testu dla dowolnego wektora danych. (Opisaliśmy to dla stałej liczby punktów danych ale można to łatwo rozszerzyć, aby pozwolić na dowolne .) Ważne jest, aby pamiętać, że na wartość p wpływa statystyka testowa tylko w skali porządkowej, którą indukujenn, więc jeśli zastosujesz monotonicznie rosnącą transformację do statystyki testu, nie ma to znaczenia dla testu hipotez (tj. jest to ten sam test). Ta właściwość matematyczna odzwierciedla jedynie fakt, że jedynym celem statystyki testowej jest wywołanie skali porządkowej na przestrzeni wszystkich możliwych wektorów danych, aby pokazać, które są bardziej sprzyjające zeru / alternatywie.

Alternatywna hipoteza wpływa na ten pomiar tylko poprzez funkcjęT , która jest wybierana na podstawie podanej zerowej i alternatywnej hipotezy w ramach całego modelu. Dlatego możemy uznać funkcję statystyki testowej za funkcję modelu ogólnego i dwie hipotezy. Na przykład w przypadku testu stosunku prawdopodobieństwa statystyka testowa jest tworzona przez przyjęcie stosunku (lub logarytmu stosunku) supremum funkcji prawdopodobieństwa w zakresach parametrów odnoszących się do hipotez zerowych i alternatywnych.Tg(M,H0,HA)M


Co to oznacza, jeśli porównamy testy z różnymi alternatywami? Załóżmy, że masz ustalony model i chcesz wykonać dwa różne testy hipotez, porównując tę ​​samą hipotezę zerową z dwiema różnymi alternatywami i . W takim przypadku będziesz mieć dwie różne funkcje statystyki testowej:MH0HAHA

T=g(M,H0,HA)T=g(M,H0,HA),

prowadzące do odpowiednich funkcji wartości p:

p(x)=P(T(X)T(x)|H0)p(x)=P(T(X)T(x)|H0).

Należy zauważyć, że jeśli i są monotonicznymi rosnącymi transformacjami względem siebie, to funkcje wartości i są identyczne, więc oba testy są tym samym testem. Jeśli funkcje i nie są monotonicznymi transformacjami rosnącymi względem siebie, mamy dwa naprawdę różne testy hipotez.TTppTT

Ben - Przywróć Monikę
źródło
2
Zgodziłbym się z tym, mówiąc, że test ma na celu odrzucenie hipotezy zerowej w obliczu ekstremalnych wyników, a rolą alternatywnej hipotezy jest wskazanie, w których wynikach byłoby postrzegane jako ekstremalne, gdyby hipoteza zerowa była prawdziwa
Henry
1

Powodem, dla którego nie chciałbym zaakceptować alternatywnej hipotezy, jest to, że nie tego testujemy. Test istotności hipotezy zerowej (NHST) oblicza prawdopodobieństwo zaobserwowania danych tak ekstremalnie, jak zaobserwowano (lub więcej), biorąc pod uwagę, że hipoteza zerowa jest prawdziwa, lub innymi słowy NHST oblicza wartość prawdopodobieństwa, która jest uwarunkowana faktem, że hipoteza zerowa jest prawdziwa , . Jest to więc prawdopodobieństwo danych przy założeniu, że hipoteza zerowa jest prawdziwa. Nigdy nie wykorzystuje ani nie podaje prawdopodobieństwa hipotezy (ani zerowej, ani alternatywnej). Dlatego gdy obserwujesz małą wartość p, wiesz tylko, że zaobserwowane dane wydają się mało prawdopodobne wP(data|H0)H0, więc zbieracie dowody przeciwko zeru i na korzyść jakiegokolwiek alternatywnego wyjaśnienia.

Przed uruchomieniem eksperymentu możesz zdecydować o poziomie odcięcia ( ), który uważa, że ​​masz znaczący wynik, co oznacza, że ​​jeśli twoja wartość p spadnie poniżej tego poziomu, wyciągniesz wniosek, że dowody na wartość zerową są tak przeważnie wysokie, że dane musiały pochodzić z innego procesu generowania danych i odrzucasz hipotezę zerową opartą na tych dowodach. Jeśli wartość p jest powyżej tego poziomu, nie odrzucasz hipotezy zerowej, ponieważ twoje dowody nie są wystarczająco istotne, aby sądzić, że twoja próbka pochodzi z innego procesu generowania danych.α

Powodem, dla którego formułujesz alternatywną hipotezę, jest to, że prawdopodobnie miałeś na myśli eksperyment przed rozpoczęciem próbkowania. Sformułowanie alternatywnej hipotezy może również decydować o tym, czy zastosujesz test jednostronny czy dwustronny, a tym samym dać większą moc statystyczną (w scenariuszu jednostronnym). Ale technicznie rzecz biorąc, aby uruchomić test, nie trzeba formułować alternatywnej hipotezy, wystarczy dane.

Stefan
źródło
NHST nie oblicza ; oblicza . To rozróżnienie jest ważne. P ( dane tak ekstremalne jak te zaobserwowane | H 0 )P(data|H0)P(data as extreme as that observed|H0)
innisfree
@innisfree Zgadzam się i dokładnie tak zdefiniowałem dane w tym samym zdaniu.
Stefan
? Nigdzie nie widzę, gdzie dane są zdefiniowane (w ten lub inny sposób)
innisfree
A jeśli tak, to po co? Po co na nowo definiować dane w ten sposób? Radzę wyjaśnić części tekstu wokół p (dane ..
innisfree