Poniższy fragment pochodzi z wpisu: Jakie są różnice między testami jednostronnymi i dwustronnymi? , na stronie pomocy dotyczącej statystyk UCLA.
... rozważ konsekwencje pominięcia efektu w innym kierunku. Wyobraź sobie, że opracowałeś nowy lek, który Twoim zdaniem stanowi ulepszenie w stosunku do istniejącego leku. Chcesz zmaksymalizować swoją zdolność do wykrycia poprawy, więc zdecyduj się na jednostronny test. W ten sposób nie testujesz możliwości, że nowy lek jest mniej skuteczny niż istniejący lek.
Po zapoznaniu się z absolutnymi podstawami testowania hipotez i przejściu do części o testach jeden na dwóch ogoniastych ... Rozumiem podstawową matematykę i zwiększoną zdolność wykrywania testów jednoetapowych itp. Ale po prostu nie mogę owinąć głowy wokół jednej rzeczy ... Jaki jest sens? Naprawdę nie rozumiem, dlaczego powinieneś podzielić swoją alfa na dwie skrajności, kiedy twój próbka jest wynikiem tylko jednego lub drugiego, albo żadnego.
Weź przykładowy scenariusz z cytowanego powyżej tekstu. Jak możesz „nie przetestować” wyniku w przeciwnym kierunku? Masz na myśli swoją próbkę. Masz na myśli swoją populację. Prosta arytmetyka mówi ci, która jest wyższa. Co jest do przetestowania lub nie do przetestowania w przeciwnym kierunku? Co Cię powstrzymuje, gdy zaczynasz od zera z hipotezą przeciwną, jeśli wyraźnie widzisz, że średnia próbki jest daleko w innym kierunku?
Kolejny cytat z tej samej strony:
Wybór testu jednostronnego po uruchomieniu testu dwustronnego, który nie odrzucił hipotezy zerowej, nie jest właściwy, bez względu na to, jak „zbliżony” do znaczącego był test dwustronny.
Zakładam, że dotyczy to również zmiany polaryzacji testu jednostronnego. Ale w jaki sposób ten „udokumentowany” wynik jest mniej ważny, niż gdybyś po prostu wybrał właściwy test jednostronny?
Najwyraźniej brakuje mi tutaj dużej części zdjęcia. To wszystko wydaje się zbyt arbitralne. Który jest, jak sądzę, w tym sensie, że to, co oznacza „statystycznie znaczące” - 95%, 99%, 99,9%… jest na początku arbitralne.
Odpowiedzi:
Pomyśl o danych jak o wierzchołku góry lodowej - wszystko, co możesz zobaczyć nad wodą, to wierzchołek góry lodowej, ale w rzeczywistości jesteś zainteresowany nauczeniem się czegoś o całej górze lodowej.
Statystycy, naukowcy zajmujący się danymi i inni pracujący z danymi starają się nie dopuścić, aby to, co widzą nad linią wody, wpłynęło na ich ocenę tego, co jest ukryte pod linią wody. Z tego powodu, w sytuacji testowania hipotez, mają tendencję do formułowania swoich zerowych i alternatywnych hipotez, zanim zobaczą wierzchołek góry lodowej, w oparciu o ich oczekiwania (lub ich brak) co do tego, co mogłoby się stać, gdyby mogli zobaczyć górę lodową w całości .
Patrzenie na dane w celu sformułowania twoich hipotez jest kiepską praktyką i należy tego unikać - to jak stawianie wózka przed koniem. Przypomnij sobie, że dane pochodzą z jednej wybranej próbki (mam nadzieję, że za pomocą losowego mechanizmu selekcji) z docelowej populacji / wszechświata będącego przedmiotem zainteresowania. Próbka ma swoje osobliwości, które mogą, ale nie muszą, odzwierciedlać populację podstawową. Dlaczego chcesz, aby twoje hipotezy odzwierciedlały wąski wycinek populacji zamiast całej populacji?
Innym sposobem myślenia o tym jest to, że za każdym razem, gdy wybierzesz próbkę z populacji docelowej (przy użyciu mechanizmu losowego wyboru), próbka da inne dane. Jeśli użyjesz danych (których nie powinieneś !!!), aby poprowadzić specyfikację hipotez zerowych i alternatywnych, twoje hipotezy będą rozłożone na całej mapie, zasadniczo oparte na specyficznych cechach każdej próbki. Oczywiście w praktyce pobieramy tylko jedną próbkę, ale bardzo niepokojąca byłaby myśl, że gdyby ktoś inny przeprowadził to samo badanie z inną próbką o tej samej wielkości, musiałby zmienić swoje hipotezy, aby odzwierciedlić rzeczywistość ich próbka.
Jeden z moich absolwentów szkoły miał bardzo mądre powiedzenie: „Nie obchodzi nas próbka, z wyjątkiem tego, że mówi nam coś o populacji” . Chcemy sformułować nasze hipotezy, aby dowiedzieć się czegoś o populacji docelowej, a nie o jednej próbie, którą wybraliśmy z tej populacji.
źródło
Wydaje mi się, że rozważając twoje pytanie, warto pamiętać o celu / punktach sprzedaży testowania istotności zerowej (NHST); to tylko jeden paradygmat (aczkolwiek bardzo popularny) do wnioskowania statystycznego, a inne mają również swoje mocne strony (np. patrz tutaj, aby omówić NHST w odniesieniu do wnioskowania bayesowskiego). Jaki jest największy atut NHST ? : Kontrola błędów w długim okresie . Jeśli postępujesz zgodnie z zasadami NHST (a czasem jest to bardzo duże, jeśli), powinieneś dobrze wiedzieć, w jakim stopniu możesz się mylić z wyciągniętymi wnioskami na dłuższą metę.
Jedną z persnickety reguł NHST jest to, że bez dalszych zmian w procedurze testowania, możesz tylko rzucić okiem na test zainteresowania. Badacze w praktyce często ignorują tę zasadę (lub nie są jej świadomi) (patrz Simmons i in., 2012), przeprowadzając wiele testów po dodaniu fal danych, sprawdzając ichp -wartości po dodaniu / usunięciu zmiennych do swoich modeli itp. Problem polega na tym, że badacze rzadko są neutralni w odniesieniu do wyników NHST; są w pełni świadomi, że znaczące wyniki będą częściej publikowane niż nieistotne (z powodów zarówno błędnych, jak i uzasadnionych; Rosenthal, 1979). Dlatego badacze są często motywowani do dodawania danych / poprawiania modeli / wybierania wartości odstających i wielokrotnego testowania, aż „odkryją” znaczący efekt (patrz John i in., 2011, dobre wprowadzenie).
Problem sprzeczny z intuicją tworzony jest przez powyższe praktyki, ładnie opisane w Dienes (2008): jeśli badacze będą dostosowywać swoją próbkę / projekt / modele, aż do osiągnięcia istotności, to pożądane długoterminowe poziomy błędów wyników fałszywie dodatnich (często ) i wyniki fałszywie ujemne (często ) będą zbliżały się odpowiednio do wartości 1,0 i 0,0 (tj. zawsze , zarówno gdy jest to fałsz, jak i gdy jest to prawda).α=.05 β=.20 H0
W kontekście konkretnych pytań badacze używają testów dwustronnych jako domyślnych, gdy nie chcą dokonywać konkretnych prognoz dotyczących kierunku efektu. Jeśli się mylą i przeprowadzą jednostronny test w kierunku efektu, ich długookresowa wartość zostanie napompowana. Jeśli spojrzą na statystyki opisowe i przeprowadzą jednostronny test na podstawie ich spojrzenia na trend, ich długoterminowa wartość zostanie zawyżona. Może się wydawać, że nie jest to duży problem w praktyce, że wartości tracą swoje długoterminowe znaczenie, ale jeśli nie zachowają swojego znaczenia, nasuwa się pytanie, dlaczego stosujesz podejście do wnioskowania, że priorytetem jest kontrola błędów w długim okresie.α pα α p
Na koniec (i ze względu na osobiste preferencje) miałbym mniejszy problem, gdybyś najpierw przeprowadził dwustronny test, stwierdził, że nie ma on znaczenia, a następnie wykonałby test jednostronny w kierunku sugerowanym przez pierwszy test, i okazało się, że jest to znaczące, jeśli (i tylko wtedy) wykonałeś ścisłą potwierdzającą replikację tego efektu w innej próbce i opublikowałeś replikację w tym samym artykule. Eksploracyjna analiza danych - z elastyczną analizą zwiększającą współczynnik błędów - jest w porządku, o ile jesteś w stanie odtworzyć swój efekt w nowej próbce bez tej samej elastyczności analitycznej.
Bibliografia
Dienes, Z. (2008). Zrozumienie psychologii jako nauki: wprowadzenie do wnioskowania naukowego i statystycznego . Palgrave Macmillan.
John, LK, Loewenstein, G., i Prelec, D. (2012). Mierzenie rozpowszechnienia wątpliwych praktyk badawczych z zachętami do mówienia prawdy. Nauki psychologiczne , 23 (5), 524–532.
Rosenthal, R. (1979). Problem z szufladą plików i tolerancja dla pustych wyników. Biuletyn psychologiczny , 86 (3), 638.
Simmons, JP, Nelson, LD i Simonsohn, U. (2011). Fałszywie pozytywna psychologia: Nieujawniona elastyczność w gromadzeniu i analizie danych pozwala przedstawić wszystko jako tak znaczące. Nauki psychologiczne , 22 (11), 1359-1366.
źródło
Niestety motywujący przykład rozwoju narkotyków nie jest dobry, ponieważ nie robimy tego, aby opracowywać leki. Stosujemy różne, bardziej rygorystyczne zasady, aby przerwać badanie, jeśli trendy są po stronie szkody. Jest to związane z bezpieczeństwem pacjentów, a także dlatego, że jest mało prawdopodobne, aby lek magicznie przechylił się w kierunku znaczącej korzyści.
Dlaczego więc przeprowadzane są dwa testy ? (kiedy w większości przypadków mamy a priori wyobrażenie o możliwym kierunku działania, próbujemy modelować)
Hipoteza zerowa powinna w pewien sposób przypominać wiarę w sens bycia wiarygodnym, poinformowanym i uzasadnionym. W większości przypadków ludzie zgadzają się, że „nieciekawy wynik” występuje, gdy występuje efekt 0, podczas gdy negatywny lub pozytywny efekt jest równy. Bardzo trudno jest sformułować złożoną hipotezę zerową, np. W przypadku, gdy wiemy, że statystyka może być równa lubmniej niż pewna ilość. Trzeba jasno powiedzieć o zerowej hipotezie, aby zrozumieć ich odkrycia naukowe. Warto zauważyć, że sposób przeprowadzania złożonego testu hipotez polega na tym, że statystyka pod hipotezą zerową przyjmuje najbardziej spójną wartość w zakresie obserwowanych danych. Jeśli więc efekt jest zgodny z oczekiwaniami, przyjmuje się, że wartość zerowa i tak wynosi 0, i niepotrzebnie poddaliśmy pod dyskusję.
Dwustronny test oznacza przeprowadzenie dwóch testów jednostronnych z kontrolą dla wielu porównań! Test dwustronny jest w rzeczywistości częściowo ceniony, ponieważ w dłuższej perspektywie okazuje się bardziej konserwatywny. Gdy mamy dobre przekonanie co do kierunku działania, testy z dwoma stronami przyniosą fałszywie dodatnie wyniki o połowę tak często, przy bardzo niewielkim ogólnym wpływie na moc.
W przypadku oceny leczenia w randomizowanym, kontrolowanym badaniu, gdybyś próbował sprzedać mi jednostronny test, powstrzymałbym cię od pytania: „Cóż, poczekaj, dlaczego uważamy, że leczenie jest rzeczywiście szkodliwe? Czy istnieją dowody poprzeć to? Czy jest nawet ekwipunek [umiejętność wykazania korzystnego efektu]? ” Logiczna niespójność stojąca za jednostronnym testem stawia pod znakiem zapytania całe badanie. Jeśli naprawdę nic nie wiadomo, każda wartość inna niż 0 jest uważana za interesującą, a test dwustronny nie jest tylko dobrym pomysłem, jest konieczny.
źródło
Jednym ze sposobów podejścia jest chwilowe zapomnienie o testowaniu hipotez i zamiast tego zastanowienie się nad przedziałami ufności. Testy jednostronne odpowiadają jednostronnym przedziałom ufności, a testy dwustronne odpowiadają dwustronnym przedziałom ufności.
Załóżmy, że chcesz oszacować średnią populacji. Oczywiście bierzesz próbkę i obliczasz średnią próbki. Nie ma powodu, aby przyjmować oszacowanie punktowe według wartości nominalnej, więc wyrażasz swoją odpowiedź w kategoriach przedziału, w którym masz pewność, że zawiera prawdziwy środek. Jaki rodzaj interwału wybierasz? Dwustronny interwał jest zdecydowanie bardziej naturalnym wyborem. Przedział jednostronny ma sens tylko wtedy, gdy po prostu nie zależy ci na znalezieniu górnej lub dolnej granicy oszacowania (ponieważ uważasz, że znasz już użyteczną granicę w jednym kierunku). Jak często jesteś tak pewny sytuacji?
Być może przełączenie pytania na przedziały ufności tak naprawdę nie zawodzi, ale metodologicznie niespójne jest preferowanie testów jednostronnych, ale dwustronnych przedziałów ufności.
źródło
Problem polega na tym, że nie znasz średniej populacji. Nigdy nie spotkałem się ze scenariuszem z prawdziwego świata, który znam prawdziwą populację.
Przeczytałem twój akapit kilka razy, ale nadal nie jestem pewien co do twoich argumentów. Czy chcesz to przeformułować? Nie można „przetestować”, jeśli dane nie trafiają do wybranych przez Ciebie krytycznych regionów.
Cytat jest poprawny, ponieważ hakowanie wartości p jest niewłaściwe. Ile wiemy o hakowaniu p „na wolności”? ma więcej szczegółów.
To jest arbitralne. Dlatego badacze danych ogólnie podają wielkość samej wartości p (nie tylko znaczącej lub nieznacznej), a także wielkość efektów.
źródło
Cóż, cała różnica polega na pytaniu, na które chcesz odpowiedzieć. Jeśli pytanie brzmi: „Czy jedna grupa wartości jest większa od drugiej?” możesz użyć testu jednostronnego. Aby odpowiedzieć na pytanie: „Czy te grupy wartości są różne?” używasz testu dwustronnego. Weź pod uwagę, że zestaw danych może być statystycznie wyższy niż inny, ale nie statystycznie inny ... i to statystyki.
źródło
Wartość alfa to prawdopodobieństwo odrzucenia wartości null, biorąc pod uwagę, że wartość null jest prawdziwa. Załóżmy, że zero oznacza, że średnia próbki jest zwykle rozkładana ze średnią zero. Jeśli P (średnia próbki> 1 | H0) = 0,05, to prawdopodobieństwo „Zbierz próbkę i odrzuć zero, jeśli średnia próbki jest większa niż 1”, ma prawdopodobieństwo, biorąc pod uwagę, że zero jest prawdziwe, 5% odrzucając zero. Reguła „Zbierz próbkę, a jeśli średnia próbki jest dodatnia, to odrzuć zero, jeśli średnia próbki jest większa niż 1, a jeśli średnia próbki jest ujemna, odrzuć zero, jeśli średnia próbki jest mniejsza niż 1” ma wartość prawdopodobieństwo, biorąc pod uwagę, że wartość null jest prawdziwa, 10% odrzucenia wartości null. Tak więc pierwsza reguła ma alfa 5%, a druga reguła alfa 10%. Jeśli zaczniesz od dwustronnego testu, a następnie zmień go na jednostronny test oparty na danych, a następnie postępujesz zgodnie z drugą regułą, więc niedokładne byłoby zgłaszanie alfa jako 5%. Wartość alfa zależy nie tylko od tego, jakie są dane, ale od zasad, których przestrzegasz podczas ich analizy. Jeśli pytasz, dlaczego warto użyć metryki, która ma tę właściwość, a nie czegoś, co zależy tylko od danych, jest to bardziej skomplikowane pytanie.
źródło
Odnośnie do drugiego punktu
mamy, że jeśli wartość null jest prawdziwa, pierwszy, dwustronny test fałszywie odrzuca z prawdopodobieństwem , ale jednostronny może również odrzucać w drugim etapie.α
Ogólne prawdopodobieństwo odrzucenia przekroczy zatem , a ty nie testujesz już na poziomie, który Twoim zdaniem testuje - częściej otrzymujesz fałszywe odrzucenia niż w przypadków, w których strategia jest stosowana do prawdziwe hipotezy zerowe.α α⋅100%
Ogólnie rzecz biorąc, szukamy które możemy wyrazić jako Dwa zdarzenia w unii są rozłączne, więc jesteśmy po Dla drugiego wyrażenia istnieje prawdopodobieństwo prawdopodobieństwa między górnymi kwantylami i (tj. punkty odrzucenia testy jednostronne i dwustronne), co jest wspólnym prawdopodobieństwem, że test dwustronny nie odrzuci, ale robi to jednostronnie. W związku z tym,
Oto mała ilustracja numeryczna:
źródło
To tylko jeden arbitralny sposób spojrzenia na to: do czego służy test statystyczny? Prawdopodobnie najczęstszym powodem do przeprowadzenia testu jest to, że chcesz przekonać ludzi (tj. Redaktorów, recenzentów, czytelników, odbiorców), że twoje wyniki są „wystarczająco losowe”, aby były godne uwagi. I jakoś doszliśmy do wniosku, że jest arbitralną, ale uniwersalną prawdą.p<α=0.05
Na każdy inny rozsądny powód, by przeprowadzić testy, nigdy nie zadowolić stałej od , ale można zmieniać swoją od przypadku do przypadku, w zależności od tego, jak ważne są konsekwencje, które czerpią z testu.0,05 αα 0.05 α
Wracając do przekonywania ludzi, że coś jest „wystarczająco dalekie od przypadkowego”, aby spełnić uniwersalne kryterium godności uwagi. Mamy niewrażliwe, ale powszechnie akceptowane kryterium, które naszym zdaniem uważa się za „nieprzypadkowe” przy przypadku testów dwustronnychα=0.05 . Równoważnym kryterium byłoby przyjrzeć się danym, zdecydować, w jaki sposób przetestować i narysować linię przy . Drugi jest równoważny z pierwszym, ale nie jest to z czym historycznie się rozliczaliśmy.α=0.025
Kiedy zaczniesz przeprowadzać jednostronne testy z , podejrzewasz, że zachowujesz się niewłaściwie, poszukujesz znaczenia. Nie rób tego, jeśli chcesz przekonać ludzi!α=0.05
Następnie jest rzecz nazywana stopniem swobody badaczy . Możesz znaleźć znaczenie w każdym rodzaju danych, jeśli masz wystarczającą ilość danych i możesz je przetestować na dowolną liczbę sposobów. Właśnie dlatego powinieneś zdecydować o przeprowadzonym teście, zanim przejrzysz dane. Wszystko inne prowadzi do niemożliwych do odtworzenia wyników testu. Radzę przejść do youtube i spojrzeć na wykład Andrew Gelmansa „Zbrodnie na danych, aby uzyskać więcej na ten temat.
źródło
Na pierwszy rzut oka żadne z tych stwierdzeń nie zapewnia, że test dwustronny jest „lepszy” od badania jednostronnego. Po prostu musi istnieć logiczne powiązanie testowanej hipotezy badawczej z testowanym wnioskiem statystycznym.
Na przykład:
Po pierwsze, jest to badanie leków. Zatem bycie niepoprawnym w przeciwnym kierunku ma znaczenie społeczne wykraczające poza ramy statystyki. Tak jak wielu twierdziło, że zdrowie nie jest najlepszym sposobem na uogólnienie.
W powyższym cytacie wydaje się, że chodzi o testowanie leku, gdy inny już istnieje. Tak więc dla mnie oznacza to, że twój lek jest już skuteczny. Stwierdzenie dotyczy późniejszego porównania dwóch skutecznych leków. Porównując te rozkłady, jeśli zaniedbujesz jedną stronę populacji w celu poprawy jej wyników porównawczych? To nie tylko stronniczy wniosek, ale porównanie nie jest już uzasadnione: porównujesz jabłka z pomarańczami.
Podobnie bardzo dobrze mogą istnieć szacunki punktowe, które ze względu na wnioskowanie statystyczne nie wpłynęły na wnioski, ale mają bardzo duże znaczenie społeczne. Jest tak, ponieważ nasza próbka reprezentuje życie ludzi: coś, co nie może „powtórzyć się” i jest nieocenione.
Alternatywnie, stwierdzenie sugeruje, że badacz ma zachętę: „chcesz zmaksymalizować swoją zdolność do wykrycia poprawy ...” To pojęcie nie jest trywialne, ponieważ sprawa jest izolowana jako zły protokół.
Ponownie oznacza to, że badacz „przełącza” swój test: z dwustronnego na jednostronny. To nigdy nie jest właściwe. Przed testowaniem konieczne jest posiadanie celu badawczego. Zawsze odchodząc od wygody dwustronnego podejścia - badaczom nie udaje się bardziej rygorystycznie zrozumieć tego zjawiska.
Oto artykuł na ten temat, który pokazuje, że testy dwustronne zostały nadużywane.
Obwinia nadużywanie dwustronnego testu brakiem:
Zajmuje stanowisko i stanowisko, że badacze:
https://www.sciencedirect.com/science/article/pii/S0148296312000550
źródło
Często przeprowadza się test istotności dla hipotezy zerowej w stosunku do hipotezy alternatywnej . To właśnie wtedy robi różnicę jedno- i dwustronny.
Dla wartości p to (dwustronne lub jednostronne) nie ma znaczenia! Chodzi o to, że wybierasz kryterium, które występuje tylko ułamek czasu, w którym hipoteza zerowa jest prawdziwa. To albo dwa małe kawałki obu ogonów, albo jeden duży kawałek jednego ogona, albo coś innego.α
Współczynnik błędów typu I nie różni się w przypadku testów jedno- lub dwustronnych.
Z drugiej strony, dla mocy ma znaczenie .
Jeśli twoja alternatywna hipoteza jest asymetryczna, to chciałbyś skoncentrować kryterium, aby odrzucić hipotezę zerową tylko na tym ogonie / końcu; tak, że gdy hipoteza alternatywna jest prawdziwa, istnieje mniejsze prawdopodobieństwo, że nie odrzuci („zaakceptuje”) hipotezy zerowej.
Jeśli twoja alternatywna hipoteza jest symetryczna (nie zależy ci na umieszczeniu większej lub mniejszej mocy po jednej określonej stronie), a ugięcie / efekt po obu stronach jest równie spodziewane (lub po prostu nieznane / niedoinformowane), wtedy bardziej skuteczne jest użycie test dwustronny (nie tracisz 50% mocy dla ogona, którego nie testujesz i gdzie popełnisz wiele błędów typu II).
Współczynnik błędów typu II jest różny dla testów jedno- i dwustronnych, a także w zależności od alternatywnej hipotezy.
To staje się bardziej podobne do koncepcji bayesowskiej, kiedy zaczynamy uwzględniać uprzedzenia, czy spodziewamy się, że efekt spadnie z jednej lub z obu stron, i kiedy chcemy skorzystać z testu (aby sprawdzić, czy możemy sfałszować hipoteza zerowa), aby „potwierdzić” lub uczynić bardziej prawdopodobnym efekt podobny do efektu.
źródło
A więc jeszcze jedna próba odpowiedzi:
Sądzę, że wybór jedno- lub dwustronnego zależy całkowicie od hipotezy Alternatywnej .
Rozważ następujący przykład średniej testowej w teście:
Teraz, jeśli zaobserwujesz bardzo ujemną średnią z próby lub bardzo pozytywną średnią z próby, twoja hipoteza jest mało prawdopodobna.
Z drugiej strony będziesz skłonny zaakceptować swoją hipotezę, jeśli średnia próbki będzie bliska niezależnie od tego, czy jest ona ujemna, czy dodatnia . Teraz musisz wybrać przedział, w którym, jeśli średnia próbki spadłaby, nie odrzuciłbyś hipotezy zerowej. Oczywiście wybrałbyś przedział, który ma zarówno ujemne, jak i dodatnie strony wokół . Więc wybierasz test z dwóch stron.0 00
Ale co jeśli nie chcesz testować , a raczej . Teraz intuicyjnie chcemy tutaj zrobić, że jeśli wartość średniej próbki jest bardzo ujemna, to możemy zdecydowanie odrzucić naszą wartość zerową. Chcielibyśmy więc odrzucić null tylko dla daleko ujemnych wartości średniej próbki.μ=0 μ≥0
Ale poczekaj! Jeśli taka jest moja hipoteza zerowa, jak ustawiłbym rozkład zerowy. Rozkład zerowy średniej próbki jest znany dla pewnej zakładanej wartości parametru populacji (tutaj ). Ale pod obecną wartością zerową może przyjąć wiele wartości.0
Powiedzmy, że możemy robić nieskończone hipotezy zerowe. Każdy za przyjęcie dodatniej wartości . Ale pomyśl o tym: w naszej pierwszej hipotezie , jeśli odrzucimy tylko zero przy obserwowaniu bardzo daleko ujemnej średniej próbki, wówczas każda kolejna hipoteza z również ją odrzuci. Ponieważ dla nich średnia próbki jest jeszcze większa od parametru populacji. W zasadzie wszystko, co musimy zrobić, to po prostu zrobić jedną hipotezę, ale jednostronną .μ H0:μ=0 H0:μ>0
Twoje rozwiązanie staje się:
Najlepszym przykładem jest test Dickeya-Fullera na stacjonarność.
Mam nadzieję że to pomoże. (Chciał dołączyć schematy, ale odpowiadał z telefonu komórkowego).
źródło