Przeczytałem lemat Neymana-Pearsona z książki Wprowadzenie do teorii statystyki Mooda, Graybilla i Boesa. Ale nie zrozumiałem lematu.
Czy ktoś może mi wyjaśnić lemat prostymi słowami? Co to oznacza?
Lemat Neymana-Pearsona: Niech będzie losową próbką z , gdzie θ jest jedną z dwóch znanych wartości θ 0 i θ 1 , i niech 0 < α < 1 zostanie naprawione.
Niech będzie dodatnią stałą, a będzie podzbiorem który spełnia: następnie test odpowiadający obszarze krytycznym jest najsilniejszym test wielkości o porównaniu
Wyrażone słowami zrozumiałem, że te dwa kryteria określają
(1) P [odrzucając hipotezę zerową | prawdziwa hipoteza zerowa] = poziom istotności
(2) odrzuć hipotezę zerową, gdy współczynnik prawdopodobieństwa , niektóre dodatnie stałe jeśli mieszczą się w obszarze krytycznym
Wtedy test jest najpotężniejszym sprawdzian z prostej hipotezy .
- Dlaczego jest to tylko proste hipotezy? Czy nie może to dotyczyć złożonej hipotezy? Czy moje wyjaśnienie słowne jest poprawne?
Niedawno napisałem wpis na blogu linksin, w którym jasno opisałem lemat Neymana Pearsona i podam przykład. Znalazłem przykładowe otwarcie oka w sensie zapewnienia jasnej intuicji na temat lematu. Jak często jest prawdopodobne, opiera się na dyskretnej funkcji masy prawdopodobieństwa, więc jest łatwy do przejęcia niż podczas pracy z plikami pdf. Weź również pod uwagę, że definiuję iloraz prawdopodobieństwa jako prawdopodobieństwo hipotezy alternatywnej względem hipotezy zerowej, w przeciwieństwie do twojego zdania lematu. Wyjaśnienie jest takie samo, ale raczej niż mniej niż jest teraz większe niż. Mam nadzieję, że to pomoże...
Ci z was, którzy pracują w analizie danych i przeszli niektóre kursy statystyki, mogli poznać lemat Neymana-Pearsona (lemat NP). Przesłanie jest proste, demonstracja nie tyle, ale zawsze trudno mi było zrozumieć, o co chodzi. Czytając książkę PIGood i JWHardin zatytułowaną „Typowe błędy w statystykach”, doszedłem do wyjaśnienia i przykładu, który pomógł mi nabrać przeczucia na temat lematy NP, którą zawsze mi brakowało.
W nie w 100% matematycznie doskonałym języku Neyman-Pearson mówi nam, że najsilniejszym testem, jaki można wymyślić, aby zweryfikować daną hipotezę na pewnym poziomie istotności, jest dany obszar odrzucenia dokonany przez wszystkie możliwe obserwacje pochodzące z tego testu z wskaźnik prawdopodobieństwa powyżej pewnego progu ... woahhh! Kto powiedział, że to łatwe!
Zachowaj spokój i zdekonstruuj lemat:
Dość definicji! (chociaż jeśli przyjrzysz się im uważnie, zdasz sobie sprawę, że są bardzo wnikliwi!). Przejdźmy do tego, co mówią nam Neyman i Pearson: jeśli chcesz mieć najlepszy możliwy test statystyczny z punktu widzenia jego mocy, po prostu określ region odrzucenia, włączając wyniki testów o najwyższym współczynniku prawdopodobieństwa i dodawaj kolejne testy wyniki, dopóki nie osiągniesz określonej wartości liczby razy, gdy test odrzuci hipotezę zerową, gdy jest ona prawdziwa (poziom istotności).
Zobaczmy przykład, w którym mam nadzieję, że wszystko się połączy. Przykład oparty jest na książce wspomnianej powyżej. Jest w całości wykonany przeze mnie, więc nie powinien być postrzegany jako odzwierciedlający rzeczywistość lub osobistą opinię.
Wyobraź sobie, że ktoś chce ustalić, czy ktoś jest za ustaleniem kwot imigracyjnych (hipoteza zerowa), czy nie (hipoteza alternatywna), zadając swoje uczucia w stosunku do Unii Europejskiej.
Wyobraź sobie, że znamy rzeczywisty rozkład prawdopodobieństwa dla obu typów osób w odniesieniu do odpowiedzi na nasze pytanie:
Wyobraźmy sobie, że jesteśmy gotowi zaakceptować fałszywie dodatni błąd w wysokości 30%, to znaczy w 30% przypadków odrzucimy hipotezę zerową i założymy, że osoba, z którą przeprowadzano wywiad, jest przeciwna kwotom, gdy jest naprawdę dla nich. Jak zbudowalibyśmy test?
Według Neymana i Pearsona najpierw przyjmiemy wynik z najwyższym współczynnikiem prawdopodobieństwa. To jest odpowiedź „naprawdę lubię UE” ze współczynnikiem 3. Z tym wynikiem, jeśli założymy, że ktoś jest przeciw kwotom, kiedy powiedział, że „naprawdę lubi UE”, 10% czasu przydzielilibyśmy dla kwot osób przeciw (znaczenie). Jednak tylko 30% czasu (władzy) klasyfikowalibyśmy względem osób objętych kwotami, ponieważ nie wszyscy w tej grupie mają takie samo zdanie na temat UE.
To wydaje się być kiepskim wynikiem, jeśli chodzi o moc. Jednak test nie popełnia wielu błędów w błędnym zaklasyfikowaniu osób objętych kwotą (znaczenie). Ponieważ jesteśmy bardziej elastyczni pod względem znaczenia, spójrzmy na kolejny wynik testu, który powinniśmy dodać do zestawu odpowiedzi, które odrzucają hipotezę zerową (region odrzucenia).
Następną odpowiedzią o najwyższym współczynniku prawdopodobieństwa jest „jak UE”. Jeśli użyjemy odpowiedzi „naprawdę lubię” i „lubię” UE jako wyniki testów, które pozwalają nam odrzucić zerową hipotezę, że ktoś jest w sprawie kwot, błędnie zaklasyfikowalibyśmy ludzi w kwotach jako nie w 30% przypadków (10% z „naprawdę lubię” i 20% z „lubię”), a 65% czasu należałoby poprawnie klasyfikować pod kątem kwot (30% z „naprawdę lubię” i 35% z „lubię”). W żargonie statystycznym: nasze znaczenie wzrosło z 10% do 30% (źle!), Podczas gdy moc naszego testu wzrosła z 30% do 65% (dobrze!).
Jest to sytuacja, którą mają wszystkie testy statystyczne. Nawet w statystykach nie ma czegoś takiego jak darmowy lunch! Jeśli chcesz zwiększyć moc swojego testu, robisz to kosztem zwiększenia poziomu istotności. Lub prościej: chcesz lepiej sklasyfikować dobrych facetów, zrobisz to kosztem, że więcej złych facetów będzie dobrze wyglądać!
Zasadniczo teraz jesteśmy skończeni! Stworzyliśmy najmocniejszy test, jaki mogliśmy, z podanymi danymi i poziomem istotności 30%, używając etykiet „naprawdę lubię” i „lubię”, aby ustalić, czy ktoś jest przeciw kwotom ... jesteśmy pewni?
Co by się stało, gdybyśmy wzięli udział w drugim kroku po wybraniu odpowiedzi „naprawdę jak”, odpowiedzi „obojętnej” zamiast „lubiącej”? Znaczenie testu byłoby takie samo jak wcześniej przy 30%: 10% dla osób z kwotami odpowiada „naprawdę” lubię, a 20% dla osób z kwotami odpowiada „nie lubię”. Oba testy byłyby tak samo złe przy błędnym klasyfikowaniu jednostek kwot. Moc jednak by się pogorszyła! W nowym teście mielibyśmy moc 50% zamiast 65%, które mieliśmy wcześniej: 30% z „naprawdę lubi” i 20% z „obojętnych”. Dzięki nowemu testowi będziemy mniej precyzyjni w identyfikacji w stosunku do kwot!
Kto tu pomógł? Współczynnik prawdopodobieństwa Neyman-Osoba niezwykły pomysł! Biorąc za każdym razem odpowiedź o najwyższym współczynniku prawdopodobieństwa, zapewnił nas, że w nowym teście uwzględnimy jak najwięcej mocy (duży licznik), jednocześnie zachowując znaczenie pod kontrolą (mały mianownik)!
źródło
Kontekst
(W tej sekcji wyjaśnię tylko testowanie hipotez, wpisz jeden i dwa błędy itp. W moim własnym stylu. Jeśli nie masz nic przeciwko temu materiałowi, przejdź do następnej sekcji)
Zazwyczaj w zastosowaniach hipoteza zerowa odpowiada pewnego rodzaju status quo, podczas gdy hipoteza alternatywna jest jakimś nowym zjawiskiem, które próbujesz udowodnić lub obalić, jest prawdziwe. Na przykład możesz testować kogoś pod kątem mocy psychicznych. Przeprowadzasz standardowy test z kartami z zawijasowymi liniami lub czymś innym i każesz im odgadnąć określoną liczbę razy. Hipoteza zerowa polega na tym, że nie dostaną więcej niż jedną na pięć racji (ponieważ jest pięć kart), alternatywna hipoteza jest taka, że są psychiczne i mogą mieć więcej racji.
Pamiętając o przykładzie testu zdolności parapsychicznych, lubię odwoływać się do rodzaju błędu, w którym zerowy jest prawdziwy, ale konkludujesz alternatywę jako „ złudzenie ” (wierzysz, że facet jest psychiczny, ale nie jest), i inny rodzaj błędu, jak „ nieświadomość ”.
Lemma
Kupowanie ziemi
Serce lematu jest zatem następujące:
źródło