Jak stwierdza pytanie - czy można udowodnić hipotezę zerową? Z mojego (ograniczonego) zrozumienia hipotezy odpowiedź brzmi „nie”, ale nie potrafię znaleźć dokładnego wyjaśnienia. Czy pytanie ma ostateczną odpowiedź?
hypothesis-testing
proof
equivalence
Pulkit Sinha
źródło
źródło
Odpowiedzi:
Jeśli mówisz o prawdziwym świecie, a nie o formalnej logice, odpowiedź brzmi oczywiście. „Dowód” czegokolwiek za pomocą środków empirycznych zależy od siły wnioskowania, które z kolei jest określone przez ważność procesu testowania ocenianego w świetle wszystkiego, co wiemy o tym, jak działa świat (tj. Teorii). Ilekroć przyjmuje się, że pewne wyniki empiryczne uzasadniają odrzucenie hipotezy „zerowej”, koniecznie dokonuje się tego rodzaju osądów (ważność projektu; świat działa w określony sposób), dlatego konieczne jest przyjęcie analogicznych założeń niezbędnych do uzasadnienia wnioskowania „dowodu” null ” wcale nie stanowi problemu.
Jakie są analogiczne założenia? Oto przykład „udowodnienia zerowej”, która jest powszechna w naukach o zdrowiu i naukach społecznych. (1) Zdefiniuj „zero” lub „brak efektu” w jakikolwiek praktyczny sposób. Powiedzmy, że uważam, że powinienem postępować tak, jakby nie było znaczącej różnicy między 2 terapiami, t1 i t2, w przypadku choroby, chyba że jedno daje o 3% większe szanse na wyleczenie niż drugie. (2) Wymyśl prawidłowy projekt do testowania, czy występuje jakikolwiek efekt - w tym przypadku, czy istnieje różnica w prawdopodobieństwie odzyskania między t1 i t2. (3) Wykonaj analizę mocy, aby ustalić, czy wielkość próby jest niezbędna do wygenerowania wystarczająco wysokiego prawdopodobieństwa - na podstawie którego jestem pewien, biorąc pod uwagę, co ”zakładając, że istnieje. Zwykle ludzie mówią, że moc jest wystarczająca, jeśli prawdopodobieństwo zaobserwowania określonego efektu na określonej alfa wynosi co najmniej 0,80, ale właściwy poziom pewności jest tak naprawdę kwestią tego, jak niechętnie się mylisz - tak samo jak wtedy, gdy wybierzesz p -wartość progowa dla „odrzucenia zera”. (4) Wykonaj test empiryczny i obserwuj efekt. Jeśli jest poniżej określonej wartości „znaczącej różnicy” - 3% w moim przykładzie - „udowodniłeś”, że „nie ma efektu”.
Aby zapoznać się z dobrym podejściem do tej sprawy, patrz Streiner, DL Unicorns Do Exist: Tutorial o „Udowadnianiu” hipotezy zerowej . Canadian Journal of Psychiatry 48, 756-761 (2003).
źródło
Odpowiedź od strony matematycznej: jest to możliwe tylko wtedy, gdy „hipotezy są wzajemnie pojedyncze”.
Jeśli przez „udowodnić” masz na myśli regułę, która może „zaakceptować” (powinienem to powiedzieć :)) z prawdopodobieństwem popełnienia błędu, który wynosi zero, to szukasz czegoś, co można nazwać „testem idealnym” i to istnieje :H0
Jeśli przeprowadzasz testy, losowa zmienna jest pobierana z lub z (tj. Testowanie porównaniu z ), wówczas istnieje test idealny tylko wtedy, gdy ( i są „wzajemnie pojedyncze”).X P0 P1 H0:X⇝P0 H1:X⇝P1 P1⊥P0 P1 P0
Jeśli nie wiesz, co oznacza „wzajemnie pojedyncze”, mogę podać przykład: i (mundury na i ) wzajemnie się pojedynczo. Oznacza to, jeśli chcesz przetestowaćU[0,1] U[3,4] [0,1] [3,4]
wtedy istnieje idealny test (zgadnij, co to jest :)): test, który nigdy nie jest zły!
Jeśli i nie są pojedynczo, to nie istnieje (wynika to z „tylko jeśli część”)!P1 P0
W kategoriach niematematycznych oznacza to, że możesz udowodnić zero, tylko wtedy, gdy dowód jest już w twoich założeniach (tj. Wtedy i tylko wtedy, gdy wybrałeś hipotezę i które są tak różne, że nie można zidentyfikować pojedynczej obserwacji z jako jeden z i odwrotnie).H0 H1 H0 H1
źródło
Tak, istnieje ostateczna odpowiedź. Ta odpowiedź brzmi: nie, nie ma sposobu na udowodnienie zerowej hipotezy. O ile wiem, najlepsze, co możesz zrobić, to rzucić przedziały ufności wokół swoich oszacowań i wykazać, że efekt jest tak mały, że równie dobrze może nie istnieć.
źródło
Dla mnie ramy teoretyczne decyzji stanowią najprostszy sposób na zrozumienie „hipotezy zerowej”. Mówi w zasadzie, że muszą istnieć co najmniej dwie alternatywy: hipoteza zerowa i co najmniej jedna alternatywa. Zatem „problemem decyzyjnym” jest zaakceptowanie jednej z alternatyw i odrzucenie pozostałych (chociaż musimy sprecyzować, co rozumiemy przez „zaakceptowanie” i „odrzucenie” hipotezy). Widzę pytanie „czy możemy udowodnić hipotezę zerową?” analogicznie do „czy zawsze możemy podjąć właściwą decyzję?”. Z perspektywy teorii decyzji odpowiedź brzmi: tak, jeśli
1) w procesie decyzyjnym nie ma pewności, ponieważ wówczas matematycznym zadaniem jest ustalenie, jaka jest właściwa decyzja.
2) akceptujemy wszystkie inne przesłanki / założenia problemu. Najbardziej krytyczna (jak sądzę) jest to, że hipoteza, o której decydujemy, jest wyczerpująca, a jedna (i tylko jedna) z nich musi być prawdziwa, a pozostałe fałszywe.
Z bardziej filozoficznego punktu widzenia nie można niczego „udowodnić” w tym sensie, że „dowód” zależy całkowicie od założeń / aksjomatów, które prowadzą do tego „dowodu”. Widzę dowód jako rodzaj logicznej równoważności, a nie „fakt” lub „prawdę” w tym sensie, że jeśli dowód jest błędny, założenia, które do niego doprowadziły, są również błędne.
Stosując to do „udowodnienia hipotezy zerowej”, mogę „udowodnić”, że jest to prawdą, po prostu zakładając, że jest to prawda, lub zakładając, że jest to prawdą, jeżeli spełnione są określone warunki (takie jak wartość statystyki).
źródło
Tak, możliwe jest udowodnienie wartości zerowej - dokładnie w tym samym sensie, że można udowodnić dowolną alternatywę dla wartości zerowej. W analizie bayesowskiej jest całkowicie możliwe, że szanse na korzyść wartości zerowej w stosunku do dowolnej z proponowanych alternatyw dla niej stają się arbitralnie duże. Co więcej, fałszywe jest twierdzenie, jak twierdzą niektóre z powyższych odpowiedzi, że zero można udowodnić tylko wtedy, gdy alternatywy dla niego są rozłączne (nie nakładają się na zero). W analizie bayesowskiej każda hipoteza ma wcześniejszy rozkład prawdopodobieństwa. Rozkład ten rozkłada masę jednostkową wcześniejszego prawdopodobieństwa na proponowane alternatywy. Hipoteza zerowa stawia wszystkie wcześniejsze prawdopodobieństwa na jednej alternatywie. Zasadniczo alternatywy dla wartości zerowej mogą postawić wszystkie wcześniejsze prawdopodobieństwo na pewną alternatywę inną niż zerowa (w innym „punkcie”), ale to rzadkie. Ogólnie rzecz biorąc, zabezpieczenia alternatywne, tzn. Rozkładają tę samą masę wcześniejszego prawdopodobieństwa na inne alternatywy - albo z wyłączeniem alternatywy zerowej, albo, częściej, łącznie z alternatywą zerową. Powstaje zatem pytanie, która hipoteza stawia największe prawdopodobieństwo, w którym faktycznie spadają dane eksperymentalne. Jeśli dane spadną ciasno wokół miejsca, w którym null mówi, że powinny spaść, wówczas będzie to faworyzowanie szansy (wśród proponowanych hipotez) NAWET, ŻE JEST WŁĄCZONE W (NIEDOZWOLONE, NIE WOLNO WYŁĄCZNIE Z NIMI) ALTERNATYWY DO TO. Przekonanie, że zagnieżdżona alternatywa nie jest bardziej prawdopodobna niż zbiór, w którym jest zagnieżdżona, odzwierciedla brak rozróżnienia między prawdopodobieństwem a prawdopodobieństwem. Chociaż niemożliwe jest, aby element zestawu był mniej prawdopodobny niż cały zestaw, jest całkowicie możliwe, że prawdopodobieństwo tylnego elementu zestawu hipotez będzie większe niż prawdopodobieństwo tylnego zestawu jako całości. Tylne prawdopodobieństwo hipotezy jest iloczynem funkcji prawdopodobieństwa i wcześniejszego rozkładu prawdopodobieństwa, jaki zakłada hipoteza. Jeśli hipoteza umieści wszystkie wcześniejsze prawdopodobieństwa we właściwym miejscu (np. Na wartości zerowej), wówczas będzie miała wyższe prawdopodobieństwo z tyłu niż hipoteza, która umieści część wcześniejszego prawdopodobieństwa w niewłaściwym miejscu (nie na wartości zerowej). Tylne prawdopodobieństwo hipotezy jest iloczynem funkcji prawdopodobieństwa i wcześniejszego rozkładu prawdopodobieństwa, jaki zakłada hipoteza. Jeśli hipoteza umieści wszystkie wcześniejsze prawdopodobieństwa we właściwym miejscu (np. Na wartości zerowej), wówczas będzie miała wyższe prawdopodobieństwo z tyłu niż hipoteza, która umieści część wcześniejszego prawdopodobieństwa w niewłaściwym miejscu (nie na wartości zerowej). Tylne prawdopodobieństwo hipotezy jest iloczynem funkcji prawdopodobieństwa i wcześniejszego rozkładu prawdopodobieństwa, jaki zakłada hipoteza. Jeśli hipoteza umieści wszystkie wcześniejsze prawdopodobieństwa we właściwym miejscu (np. Na wartości zerowej), wówczas będzie miała wyższe prawdopodobieństwo z tyłu niż hipoteza, która umieści część wcześniejszego prawdopodobieństwa w niewłaściwym miejscu (nie na wartości zerowej).
źródło
Technicznie nie, nie można udowodnić hipotezy zerowej. Dla każdej ustalonej, skończonej wielkości próbki zawsze będzie jakiś mały, ale niezerowy rozmiar efektu, dla którego twój test statystyczny nie ma praktycznie żadnej mocy. Praktycznie jednak możesz udowodnić, że mieścisz się w niewielkim epsilonie hipotezy zerowej, tak że odchylenia mniejsze niż ten epsilon nie są praktycznie znaczące.
źródło
Istnieje przypadek, w którym dowód jest możliwy. Załóżmy, że masz szkołę, a twoją zerową hipotezą jest to, że liczba chłopców i dziewcząt jest równa. Wraz ze wzrostem wielkości próby niepewność w stosunku chłopców do dziewcząt ma tendencję do zmniejszania się, ostatecznie osiągając pewność (co, jak zakładam, rozumiesz przez dowody), kiedy pobierana jest próbka z całej populacji uczniów.
Ale jeśli nie masz skończonej populacji lub jeśli próbujesz z zamiennikiem i nie możesz dostrzec osobników, u których dokonano ponownej próby, nie możesz zredukować niepewności do zera za pomocą skończonej próbki.
źródło
Chciałbym tutaj omówić kwestię, w której wielu użytkowników jest nieco zdezorientowanych. Jakie jest prawdziwe znaczenie hipotezy zerowej H0: p = 0? Czy próbujemy ustalić, czy parametr p wynosi zero? Oczywiście, że nie, nie ma sposobu na osiągnięcie takiego celu.
Zamierzamy ustalić, że biorąc pod uwagę zestaw danych, oszacowana wartość parametru jest (lub nie) nierozróżnialna od zera. Pamiętaj, że NHST jest „niesprawiedliwy” wobec alternatywnych hipotez: zeru przypisuje się 95% poziom ufności, a tylko 5% alternatywie. W rezultacie „nieistotny” wynik nie oznacza, że H0 utrzymuje się, ale po prostu nie znaleźliśmy wystarczających dowodów na to, że alternatywa jest prawdopodobna.
źródło