Tradycyjne testy statystyczne, takie jak test t dwóch próbek, koncentrują się na próbie wyeliminowania hipotezy, że nie ma różnicy między funkcją dwóch niezależnych próbek. Następnie wybieramy poziom ufności i mówimy, że jeśli różnica średnich przekracza poziom 95%, możemy odrzucić hipotezę zerową. Jeśli nie, „nie możemy odrzucić hipotezy zerowej”. Wydaje się to sugerować, że nie możemy tego zaakceptować. Czy to oznacza, że nie jesteśmy pewni, czy hipoteza zerowa jest prawdziwa?
Teraz chcę zaprojektować test, w którym moja hipoteza jest taka, że funkcja dwóch próbek jest taka sama (co jest przeciwieństwem tradycyjnych testów statystycznych, w których hipoteza jest taka, że dwie próbki są różne). Tak więc moją hipotezą zerową jest to, że dwie próbki są różne. Jak zaprojektować taki test? Czy to będzie tak proste, jak powiedzenie, że jeśli wartość p jest mniejsza niż 5%, możemy zaakceptować hipotezę, że nie ma znaczącej różnicy?
Odpowiedzi:
Tradycyjnie hipoteza zerowa jest wartością punktową. (Zazwyczaj jest to , ale w rzeczywistości może być dowolną wartością punktową). Alternatywna hipoteza jest taka, że prawdziwa wartość to dowolna wartość inna niż wartość zerowa . Ponieważ zmienna ciągła (taka jak średnia różnica) może przyjmować wartość, która jest nieskończenie bliska wartości zerowej, ale wciąż nie do końca równa, a zatem hipoteza zerowa jest fałszywa, nie można udowodnić tradycyjnej hipotezy punktowej.0
Wyobraź sobie, że twoja hipoteza zerowa wynosi , a średnia zaobserwowana różnica wynosi . Czy uzasadnione jest założenie, że hipoteza zerowa jest prawdziwa? Jeszcze nie wiesz; dobrze byłoby wiedzieć, jak wygląda nasz przedział ufności . Powiedzmy, że 95% przedział ufności wynosi . Czy powinniśmy teraz stwierdzić, że prawdziwa wartość wynosi ? Nie czułbym się komfortowo, mówiąc o tym, ponieważ CI jest bardzo szeroki i istnieje wiele dużych niezerowych wartości, które moglibyśmy podejrzewać, że są zgodne z naszymi danymi. Powiedzmy, że zbieramy znacznie, dużo więcej danych, a teraz nasza zaobserwowana średnia różnica wynosi , ale 95% CI wynosi0 0.01 (−4.99, 5.01) 0 0.01 (0.005, 0.015) . Obserwowana średnia różnica pozostała taka sama (co byłoby niesamowite, gdyby to się naprawdę wydarzyło), ale przedział ufności wyklucza teraz wartość zerową. Oczywiście jest to tylko eksperyment myślowy, ale powinien wyjaśnić podstawowe idee. Nigdy nie możemy udowodnić, że prawdziwą wartością jest jakaś konkretna wartość punktowa; możemy tylko (prawdopodobnie) obalić, że jest to jakaś wartość punktowa. W statystycznym testowaniu hipotez fakt, że wartość p wynosi> 0,05 (i że 95% CI obejmuje zero) oznacza, że nie jesteśmy pewni, czy hipoteza zerowa jest prawdziwa .
Jeśli chodzi o konkretny przypadek, nie można skonstruować testu, w którym alternatywną hipotezą jest, że średnia różnica wynosi a hipoteza zerowa jest inna niż zero. To narusza logikę testowania hipotez. Jest całkowicie uzasadnione, że jest to twoja merytoryczna, naukowa hipoteza, ale nie może być twoją alternatywną hipotezą w sytuacji testowania hipotez.0
Więc co możesz zrobić? W tej sytuacji używasz testu równoważności. (Możesz przeczytać niektóre z naszych wątków na ten temat, klikając znacznik równoważności .) Typową strategią jest zastosowanie metody testów dwustronnych. Bardzo krótko wybierasz przedział, w którym można uznać, że prawdziwa średnia różnica może również wynosić0 dla wszystkiego, co możesz obchodzić, wówczas wykonujesz test jednostronny, aby ustalić, czy zaobserwowana wartość jest mniejsza niż górna granica tego przedziału, oraz kolejny test jednostronny, aby sprawdzić, czy jest ona większa niż dolna granica. Jeśli oba te testy są znaczące, to odrzuciłeś hipotezę, że prawdziwa wartość jest poza przedziałem, na którym ci zależy. Jeśli jeden (lub oba) są nieistotne, nie odrzucasz hipotezy, że prawdziwa wartość jest poza przedziałem.
Na przykład załóżmy, że wszystko w przedziale jest tak bliskie zeru, że uważasz, że jest zasadniczo takie samo jak zero dla twoich celów, więc używasz tego jako merytorycznej hipotezy. Teraz wyobraź sobie, że otrzymujesz pierwszy wynik opisany powyżej. Chociaż mieści się w tym przedziale, nie można odrzucić hipotezy zerowej w żadnym jednostronnym teście, więc nie można odrzucić hipotezy zerowej. Z drugiej strony wyobraź sobie, że masz drugi opisany powyżej wynik. Teraz okazuje się, że zaobserwowana wartość mieści się w wyznaczonym przedziale, i można wykazać, że jest ona zarówno mniejsza niż górna granica, jak i większa niż dolna granica, więc możesz odrzucić wartość zerową. (Warto zauważyć, że możesz odrzucić oba(−0.02, 0.02) 0.01 hipoteza, że prawdziwa wartość wynosi , oraz hipoteza, że prawdziwa wartość leży poza przedziałem , co może początkowo wydawać się kłopotliwe, ale jest w pełni zgodne z logiką testowania hipotez.) 0 (−0.02, 0.02)
źródło
Rozważmy przypadek, w którym hipoteza zerowa mówi, że moneta ma 2 główki, tzn. Prawdopodobieństwo głów wynosi 1. Teraz dane są wynikiem rzutu monetą raz i zobaczenia głów. Daje to wartość p 1,0, która jest większa niż każda rozsądna wartość alfa. Czy to oznacza, że moneta jest dwugłowa? może tak być, ale może to być również uczciwa moneta i widzieliśmy głowy z przypadkiem (zdarzyłoby się to w 50% przypadków z uczciwą monetą). Tak więc wysoka wartość p w tym przypadku mówi, że obserwowane dane są idealnie zgodne z wartością zerową, ale są również zgodne z innymi możliwościami.
Podobnie jak wyrok „Niewinny” w sądzie może oznaczać, że oskarżony jest niewinny, może być również spowodowany winnym, ale brak wystarczających dowodów. To samo z hipotezą zerową, której nie odrzucamy, ponieważ zerowa może być prawdziwa lub być może nie mamy wystarczających dowodów do odrzucenia, nawet jeśli jest fałszywa.
źródło
Brak dowodów nie jest dowodem nieobecności (tytuł pracy Altmana, Blanda na BMJ). Wartości p dają nam dowód nieobecności tylko wtedy, gdy uznamy je za znaczące. W przeciwnym razie nic nam nie mówią. Stąd brak dowodów. Innymi słowy: nie wiemy, a więcej danych może pomóc.
źródło
Jeśli mamy dwie próbki, w których spodziewamy się identycznej dystrybucji, wówczas nasza hipoteza zerowa jest taka, że próbki są takie same. Jeśli mamy dwie próbki, których spodziewalibyśmy się (dziko) różne, nasza hipoteza zerowa jest taka, że są one różne.
źródło