W wielu miejscach przeczytałem, że nigdy nie możemy powiedzieć, że „akceptujemy” hipotezę zerową. Zamiast tego musimy powiedzieć, że „nie odrzucamy” hipotezy zerowej.
Ale nie rozumiem, jak to wygląda w tym prostym przykładzie: Załóżmy, że testujemy lek, który ma całkowicie wyleczyć cukrzycę w ciągu 24 godzin. Wypróbowujemy to na 1000 pacjentach i wszyscy nadal chorują na cukrzycę po zażyciu leku.
Czy to nie oczywiste, że ten lek nie leczy cukrzycy? tzn. że akceptujemy hipotezę zerową?
Na pewno nie uwierzyłbym w ten lek.
Hipoteza zerowa: lek nie ma wpływu na pacjentów.
Alternatywna hipoteza: lek leczy cukrzycę
hypothesis-testing
Jonathan Aquino
źródło
źródło
Odpowiedzi:
Możliwość pierwsza: Lek ma bardzo mały efekt. Być może leczy .0001% osób go przyjmujących. Test, który nakreśliłeś tylko sugeruje, że nie ma wystarczających dowodów na dramatyczną alternatywę, którą zaproponowałeś.
Możliwość druga: Lek ma bardzo silny negatywny wpływ. (Podziękowania dla @ssdecontrol) Być może lek nie działa i wszyscy ci pacjenci byliby lepsi sami, ale z powodu leku żaden z pacjentów nie wyzdrowiał.
Bez wcześniejszej wiedzy dane byłyby zgodne z tymi możliwościami, a także z możliwością, że wartość null jest prawdziwa.
Zatem odrzucenie wartości null nie oznacza, że wartość null jest bardziej prawdziwa niż te inne możliwości.
źródło
Jest tu kilka dobrych odpowiedzi, ale myślę, że kluczową kwestią nigdzie nie jest wyraźnie określone. Krótko mówiąc, sformułowanie hipotez zerowych i alternatywnych jest nieprawidłowe. Hipotezy zerowe i alternatywne muszą się wzajemnie wykluczać (to znaczy, że obie nie mogą być prawdziwe). Twoje sformułowanie spełnia to kryterium. Muszą jednak być również zbiorowo wyczerpujące (to znaczy jedno z nich musi być prawdziwe). Twój preparat nie spełnia tego kryterium.
Nie możesz mieć zerowej hipotezy, że lek ma0 % szansa na wyleczenie cukrzycy i alternatywna hipoteza, że lek ma 100 % szansa na wyleczenie cukrzycy. Wyobraź sobie, że prawdziwe jest prawdopodobieństwo, że lek wyleczy cukrzycę50 % , zarówno twoja wartość zerowa, jak i alternatywne hipotezy są fałszywe. To jest twój problem.
Prototypowa hipoteza zerowa jest wartością punktową (np.0 na prawdziwej linii liczbowej lub najczęściej 50 % odnosząc się do prawdopodobieństw, ale są to tylko konwencje). Ponadto, jeśli pracujesz z ograniczoną przestrzenią parametrów (jak tu jesteś - prawdopodobieństwa muszą mieścić się w granicach)[ 0 , 1 ] ), generalnie problematyczne jest testowanie wartości, które są na granicy (tj. 0 lub 1 ). Po wybraniu wartości punktowej jako wartości zerowej (wartości, którą chcesz odrzucić), możesz uzyskać dowody przeciwko niej, ale nie możesz uzyskać dowodów na jej podstawie z twoich danych (por. Wnikliwa odpowiedź Johna ). Aby to lepiej zrozumieć, może pomóc ci przeczytać moją odpowiedź tutaj: dlaczego statystycy twierdzą, że nieistotny wynik oznacza „nie możesz odrzucić wartości zerowej” w przeciwieństwie do przyjęcia hipotezy zerowej? Aby zastosować te pomysły do konkretniej sytuacji, nawet jeśli nie było0 % (i stąd twoja alternatywna hipoteza była π≠0 ) i próbowałeś tego narkotyku 100 ,000 u pacjentów, którzy nie zostali wyleczeni, nie można zaakceptować zerowej hipotezy: Dane nadal byłyby zgodne z możliwością, że prawdopodobieństwo 0,00003 (patrz: Jak określić prawdopodobieństwo awarii, jeśli nie wystąpiły awarie? ).
Z drugiej strony nie musisz mieć punktu zerowego. Jednostronny (tj.<θ0 ) na przykład hipotezy zerowe nie są punktami. Są to zestawy nieskończonych punktów. Podobnie możesz mieć hipotezę zakresu / przedziału (np. Że parametr jest w środku[ a , b ] ). W takim przypadku możesz zaakceptować wartość zerową na podstawie dowodów - na tym właśnie polega badanie równoważności. (Oczywiście nadal możesz popełniać błąd typu I.)
źródło
Jak skomentowali inni użytkownicy, problem z zaakceptowaniem hipotezy zerowej polega na tym, że nie mamy wystarczających dowodów (i nigdy nie będziemy), aby stwierdzić, że efekt wynosi dokładnie 0. Matematycznie testowanie hipotez zasadniczo nie jest w stanie odpowiedzieć na takie pytania .
Nie oznacza to jednak, że cel twojego pytania nie jest prawidłowy! W rzeczywistości jest to zwykle cel badań klinicznych leków generycznych: celem nie jest wykazanie, że wyprodukowałeś bardziej skuteczny lek, ale raczej, że twój lek jest zasadniczo tak samo skuteczny jak marka markowa (i możesz produkować przy znacznie niższym koszcie). Równoważność jest zwykle uważana za hipotezę zerową.
Aby odpowiedzieć na to pytanie za pomocą testowania hipotez, pytanie jest przekształcane w taki sposób, aby można było na nie odpowiedzieć. Przeformatowane pytanie wygląda mniej więcej tak:
gdzieβsol jest efektem ogólnych i βn b jest efektem markowego leku. Jeśli więc odrzucimy hipotezę zerową, możemy stwierdzić, że rodzajowa jest co najmniej 75% tak skuteczna jak nazwa marki. Oczywiście nie jest to to samo, co powiedzenie dokładnie równoważnego, ale dotyczy pytania, które Cię interesuje (i w sposób, który moim zdaniem jest matematycznie bardziej uzasadnionym pytaniem).
Możemy podejść do twojego pytania w podobny sposób. Zamiast próbować powiedzieć „czy mamy wystarczającą ilość dowodów, aby dojść do wniosku, że nie ma efektu?”, Możemy zapytać „biorąc pod uwagę nasze dowody, jaki jest maksymalny efekt, dla którego nasze wyniki nie były zbyt niezwykłe?”. Zn = 1000 i 0 sukcesów, możemy stwierdzić, że mamy wystarczające dowody, aby stwierdzić, że prawdopodobieństwo sukcesu wynosi mniej niż 0,3% (na podstawie dokładnego testu Fishera α = 0,05 ).
Na podstawie tego wyniku z pewnością możesz nadal stwierdzić, że nie jest to lek, w który będziesz wierzyć.
źródło
Załóżmy, że lek działa, ale tylko na 0,00001% populacji. Lek działa, kropka. Jakie są szanse na wykrycie statystycznie, że działa na próbie 10000 osób? 100 000 osób? 1 000 000 osób?
źródło
Błędem jest twierdzenie, że nigdy nie można zaakceptować hipotezy zerowej. Wyciągasz informacje z podręcznika z kontekstu. To, czego nie możesz zrobić, to zastosować test hipotezy zerowej, aby go zaakceptować. Test służy do odrzucenia hipotezy. Zauważ, że twój własny argument za akceptacją ma niewiele wspólnego z wynikiem testu. Chodzi o dane. Przeprowadzenie testu w twoim przykładzie byłoby raczej nierozsądne. Możesz użyć swoich danych, aby argumentować, że akceptujesz hipotezę zerową. Nie ma w tym nic złego. Po prostu nie możesz użyć do tego wyników testu.
Powodem, dla którego nie można samodzielnie zastosować testu hipotez, jest to, że nie jest on do tego przeznaczony. Jeśli nie rozumiesz, że z podręczników jest to zrozumiałe. W rzeczywistości jest to interesujący paradoks, że wartość p faktycznie oznacza coś, tylko jeśli wartość null jest prawdziwa, ale nie można jej użyć do wykazania, że wartość null jest prawdziwa. Aby to ułatwić, może po prostu weź pod uwagę czułość mocy. Zawsze możesz po prostu zebrać o wiele za mało próbek i nie odrzucić wartości zerowej. Ponieważ możesz to zrobić, jasne jest, że sam test nie jest prawidłowym powodem do zaakceptowania wartości null. Ale znowu, to nie znaczy, że nigdy nie możesz powiedzieć, że zero jest prawdziwe. Oznacza to tylko, że test nie jest podstawą do twierdzenia, że wartość zerowa jest prawdziwa.
UWAGA : Istnieje argument brzytwy Ockhama, że powinieneś zaakceptować wartość zerową, jeśli nie odrzucisz; ale test nie mówi ci, żebyś zaakceptował wartość zerową. To, co robisz, to zaakceptowanie wartości null jako domyślnej, a jeśli nie odrzucisz testu, utrzymasz stan domyślny. Więc nawet w tym przypadku wartość zerowa nie jest akceptowana z powodu testu.
źródło
Przeglądając twoje komentarze, myślę, że jesteś bardzo zainteresowany tym pytaniem: dlaczego możemy zgromadzić wystarczającą ilość dowodów, aby odrzucić zero , ale nie alternatywę , tj. Co sprawia, że hipoteza testująca jednostronną ulicę?
Bardzo ważną rzeczą do przemyślenia jest to, jakie wartości stanowią hipotezę zerową? W twoim przykładzie jest to tylko jedna wartość,i . e . , p = 0 . Alternatywą jest natomiastp > 0 .
Akceptujemy każdą hipotezę, jeśli wszystkie „rozsądne wartości” (tj. Wartości mieszczące się w naszym przedziale ufności) mieszczą się całkowicie w zakresie podanym przez tę hipotezę. Więc jeśli wszystkie nasze rozsądne wartości są większe niż 0, zaakceptowalibyśmy alternatywę. Z drugiej strony hipoteza zerowa jest tylko jednym punktem, 0! Aby zaakceptować wartość zerową, musielibyśmy mieć przedział ufności o długości 0 . Ponieważ (ogólnie) przedział ufności długości zbliża się do 0 jakon → ∞ , ale nie osiąga długości 0 dla skończonego n , musielibyśmy zebrać nieskończoną ilość danych, aby stwierdzić, że nie mamy marginesu błędu w naszych szacunkach.
Zauważ jednak, że jeśli zdefiniujemy hipotezę zerową jako coś więcej niż pojedynczy punkt, tj. Jednostronny test hipotezy, taki jak
rzeczywiście można przyjąć hipotezę zerową. Załóżmy, że nasz przedział ufności powinien wynosić (0,35; 0,45). Wszystkie te wartości są mniejsze lub równe 0,5, co znajduje się w obszarze hipotezy zerowej. W takim przypadku moglibyśmy zaakceptować wartość zerową.
Małe, techniczne, nadużycie statystyki Uwaga: jeśli ktoś naprawdę chce nadużywać teorii asymptotycznej, faktycznie może (ale nie powinien ...) zaakceptować zerową wartość w twoim przykładzie: asymptotyczny błąd standardowy to(p^( 1 -p^) / n )----------√= 0 . Zatem asymptotyczny przedział ufności wyniesie (0,0), a wszystko to należy do hipotezy zerowej. Ale to tylko nadużywanie wyników asymptotycznych; zauważ, że wyciągasz taki sam wniosek, nawet jeślin = 1
źródło
Wiem, że masz do czynienia z hipotezą zerową, ale prawdziwym problemem jest podany przykład lub jak podano prosty przykład. 1000 osób otrzymuje lek i to nie działa. Jakie inne dolegliwości miały ci ludzie, jaki był ich wiek i etapy choroby. Aby zadeklarować hipotezę zerową więcej informacji; prawdopodobnie szczegółowy; należy podać, aby ta praca działała w środowisku naukowym.
źródło