Czy możemy zaakceptować wartość zerową w testach nieszerokości?

11

W zwykłym t-teście średnich, przy użyciu zwykłych metod testowania hipotez, albo odrzucamy wartość zerową, albo nie odrzucamy wartości zerowej, ale nigdy nie akceptujemy wartości zerowej. Jednym z powodów jest to, że jeśli otrzymamy więcej dowodów, ten sam rozmiar efektu stałby się znaczący.

Ale co dzieje się w teście nieszerokości?

To jest:

H.0:μ1-μ0x

vs.

H.1:μ1-μ0>x

gdzie jest kwotą, którą uważamy za zasadniczo taką samą. Tak więc, jeśli odrzucimy zero, mówimy, że jest większe niż o co najmniej . Nie odrzucamy wartości zerowej, jeśli nie ma wystarczających dowodów. xμ1μ0x

Jeśli wielkość efektu wynosi lub więcej, jest to analogiczne do zwykłego testu t. Ale co jeśli wielkość efektu jest mniejsza niż w próbce, którą mamy? Następnie, jeśli zwiększymy wielkość próbki i utrzymamy ten sam efekt, pozostanie on nieistotny. Czy możemy zatem zaakceptować wartość zerową w tym przypadku?xx

Peter Flom
źródło
1
Czy twoje hipotezy są pomieszane? Zwykle dla testu NI hipotezą zerową jest to, że różnica jest większa niż x, podczas gdy alternatywnie jest to, że jest mniejsza lub równa x. Myślę, że to zależy od kolejności twojej skali różnicy.
Björn
Cześć @ Björn to zależy od tego, czy wyższa jest gorsza, czy wyższa jest lepsza.
Peter Flom
1
Czy to jest to samo, co pytanie, czy można zaakceptować wartość zerową w jednostronnych testach? Dyskutowano o tym w komentarzach do stats.stackexchange.com/a/85914 .
ameba
2
@amoeba Myślę, że Peter przedstawia fascynujący argument (+1), być może bardziej zbliżony do paradoksu. Jednym z konwencjonalnych wyjaśnień, dlaczego nie „akceptujemy H0”, który czasami słyszy, jest „jeśli otrzymamy więcej dowodów, ten sam rozmiar efektu stałby się znaczący”. Ale kierując się tą logiką, podobnie jak Piotr, dochodzimy do wniosku, że w niektórych sytuacjach powinniśmy „zaakceptować H0”, a jeśli nie, że „powód” jest w rzeczywistości niewłaściwy, a nie dlaczego w ogóle to robimy. Uważam, że masz rację - jego argument dotyczyłby również jednostronnych testów t, ponieważ wielkość efektu negatywnego pozostaje nieznaczna wraz ze wzrostem liczby n
Silverfish
1
Tak, zgadzam się: linkowana odpowiedź nie odpowiada na twoje pytanie. Podałem tylko ten link, ponieważ w komentarzach była podobna dyskusja.
ameba

Odpowiedzi:

7

Twoja logika obowiązuje dokładnie w ten sam sposób, co stare dobre jednostronne testy (tj. Z x=0), które mogą być bardziej znane czytelnikom. Jeśli chodzi o konkretność, wyobraź sobie, że testujemy zeroH.0:μ0 w przeciwieństwie do tego μjest pozytywny. Jeśli to prawdaμ jest ujemny, zwiększenie wielkości próby nie przyniesie znaczącego wyniku, tzn. używając twoich słów, nie jest prawdą, że „gdybyśmy otrzymali więcej dowodów, ten sam rozmiar efektu stałby się znaczący”.

Jeśli przetestujemy H.0:μ0, możemy uzyskać trzy możliwe wyniki:

  1. Pierwszy, (1-α)100%przedział ufności może być całkowicie powyżej zera; następnie odrzucamy zero i akceptujemy alternatywę (toμ jest pozytywny).

  2. Po drugie, przedział ufności może być całkowicie poniżej zera. W tym przypadku nie odrzucamy wartości zerowej. Jednak w tym przypadku uważam, że można powiedzieć, że „akceptujemy zero”, ponieważ możemy to rozważyćH.1 jako kolejny zerowy i odrzuć ten.

  3. Po trzecie, przedział ufności może zawierać zero. Zatem nie możemy odrzucićH.0 i nie możemy odrzucić H.1 albo, więc nie ma nic do zaakceptowania.

Powiedziałbym więc, że w sytuacjach jednostronnych można zaakceptować wartość zerową, tak. Ale nie możemy tego zaakceptować po prostu dlatego, że nie odrzuciliśmy go; są trzy możliwości, a nie dwie.

(Dokładnie to samo dotyczy testów równoważności, zwanych także „testami dwustronnymi” (TOST), testami braku niższości itp. Można odrzucić wartość zerową, zaakceptować wartość zerową lub uzyskać wynik niejednoznaczny).

Natomiast kiedy H.0 jest punktem zerowym, takim jak H.0:μ=0nigdy nie możemy tego zaakceptować, ponieważ H.1:μ0 nie stanowi prawidłowej hipotezy zerowej.

(Chyba że μmoże mieć tylko wartości dyskretne, np. musi być liczbą całkowitą; wydaje się, że moglibyśmy zaakceptowaćH.0:μ=0 ponieważ H.1:μZ,μ0teraz stanowi prawidłową hipotezę zerową. Jest to jednak szczególny przypadek).


Zagadnienie to zostało omówione jakiś czas temu w komentarzach pod odpowiedzią @ gung tutaj: Dlaczego statystycy twierdzą, że nieistotny wynik oznacza „nie można odrzucić wartości zerowej” w przeciwieństwie do przyjęcia hipotezy zerowej?

Zobacz także ciekawy (i niedoceniony) wątek Czy brak odrzucenia zera w podejściu Neymana-Pearsona oznacza, że ​​należy go „zaakceptować”? , gdzie @Scortchi wyjaśnia, że ​​w środowisku Neyman-Pearson niektórzy autorzy nie mają problemu z mówieniem o „akceptowaniu wartości zerowej”. To też oznacza @Alexis w ostatnim akapicie jej odpowiedzi tutaj.

ameba
źródło
Jeśli… (1-α) przedział ufności jest całkowicie powyżej zera, a następnie odrzuć zero μ0: to test z najgorszym przypadkiem wielkości α2). Jeśli…(1-α) przedział ufności jest całkowicie poniżej zera, a następnie odrzuć zero μ>0: to test z najgorszym przypadkiem wielkości α2). Łącząc dwa testy, możesz zachować najgorszy rozmiarα2)ponieważ dwie wartości null wykluczają się wzajemnie. Zatem trzy wyniki można opisać w kategoriach zaakceptowania jednej alternatywy lub innej alternatywy lub odrzucenia żadnej z nich.
Scortchi - Przywróć Monikę
Dwustronny test można traktować podobnie, jak złożony z dwóch testów jednostronnych; ale alternatywy nie wykluczają się wzajemnie, a najgorszy przypadek toα (kiedy μ=0).
Scortchi - Przywróć Monikę
Dzięki @Scortchi. Jakoś nie jestem pewien, czy zgadzasz się z moją odpowiedzią, czy nie.
ameba
Tak jak μ0nie jest akceptowany qua null w jednym teście, ale qua alternate w innym, czuję, że „akceptowanie null” jest tutaj niepotrzebnie mylące; jednak twoja procedura powinna zadowolić tych, którzy mają na to ochotę. To, co być może zasługuje na większy nacisk w twojej odpowiedzi, to różnica między łączeniem testów na nie-niższość a niższość i odwrotnie , a testami na wyższość vs. .
Scortchi - Przywróć Monikę
@Scortchi Składnia twojego ostatniego zdania jest dość skomplikowana: co dokładnie można (lub czego nie można połączyć) i jaka dokładnie jest różnica? Przepraszam, nie jestem pewien, czy dobrze cię zrozumiałem.
ameba
6

Nigdy „nie akceptujemy hipotezy zerowej” (bez uwzględnienia mocy i minimalnego rozmiaru odpowiedniego efektu). Za pomocą pojedynczego testu hipotez stawiamy stan natury,H.0, a następnie odpowiedz na pewną odmianę pytania „jak mało prawdopodobne jest zaobserwowanie danych leżących u podstaw naszej statystyki testowej, przy założeniu H.0 (a nasze założenie dystrybucyjne) jest prawdą? ”Wtedy będziemy odrzucać nasze lub nie będziemy odrzucać naszych H.0 na podstawie preferowanego poziomu błędu typu I i wyciągnij wniosek, który zawsze dotyczy H.ZA… To znaczy znaleźliśmy dowody na zakończenie H.ZAlub nie znaleźliśmy dowodów na wyciągnięcie wniosków H.ZA. Nie akceptujemyH.0ponieważ nie szukaliśmy na to dowodów. Brak dowodów (np. Różnicy) nie jest tym samym, co dowód nieobecności (np. Różnicy). .

Dotyczy to testów jednostronnych, tak jak to jest dla testów dwustronnych: my tylko szukać dowodów na korzyśćH.ZA i znajdź to albo nie znajdź.

Gdybyśmy tylko stanowią jedenH.0(nie zwracając uwagi zarówno na minimalną istotną wielkość efektu, jak i moc statystyczną), skutecznie podejmujemy a priori zobowiązanie do uprzedzeń potwierdzających , ponieważ nie szukaliśmy dowodów naH.0, tylko dowód na H.ZA. Oczywiście, może (i, ośmielę się powiedzieć, powinien ) hipotezy zerowej pozy za i przeciw pozycji ( testów trafności które łączą testy dla różnicy (H.0+) z testami równoważności (H.0-) zrób to).

Wydaje mi się, że nie ma powodu, dla którego nie można łączyć wnioskowania z jednostronnego testu niższości z jednostronnym testem nie-niższości, aby dostarczyć dowody (lub brak dowodów) w obu kierunkach jednocześnie.

Oczywiście, jeśli rozważa się moc i wielkość efektu, a nie odrzuca sięH.0, ale wie, że istnieje (a) pewna minimalna istotna wielkość efektu δoraz (b) że ich dane są wystarczająco silne, aby wykryć je dla danego testu, można to zinterpretować jako dowód H.0.

Alexis
źródło
1
Pytanie Piotra zawierało szczególnie interesujący punkt, w którym ta odpowiedź wydaje się omijać: że jednym z konwencjonalnych wyjaśnień standardowej terminologii „nie odrzuca się H0” jest to, że np. W teście t, jeśli otrzymamy więcej dowodów, ten sam efekt rozmiar stałby się znaczący. Ale gdyby to był „prawdziwy” powód, dla którego „nie odrzucamy”, jego argument, że moglibyśmy „zaakceptować H0” w okolicznościach, które zarysował, wydaje mi się (przynajmniej dla mnie) silny - chociaż nie jestem pewien, czy widziałem, że robi się to inaczej niż przypadkowo, jako rodzaj statystycznego slangu, a nie świadomie i celowo.
Silverfish,
1
Ta odpowiedź potwierdza konwencjonalne stanowisko w sprawie „akceptacji H0” w ładny, jasny, zwięzły sposób, ale nie wydaje się bezpośrednio odnosić się do argumentu (a może paradoksu) leżącego u podstaw pytania Piotra. Co sądzisz o „nie możemy zaakceptować H0, ponieważ jeśli otrzymamy więcej dowodów, ten sam rozmiar efektu stałby się znaczący” argument za konwencjonalną terminologią - czy jest jakaś wada w prezentacji lub rozszerzeniu Petera, czy też była logika pierwotnego argumentu jest nieprawidłowy?
Silverfish,
1
@Silverfish podążam za linkiem w mojej odpowiedzi na „testy trafności” w celu dalszego wzmocnienia mojej krytycznej rozdzielczości w kwestii „nie możemy zaakceptować H0, ponieważ gdybyśmy mieli więcej dowodów, ten sam rozmiar efektu stałby się znaczący”
Alexis
1
@Alexis Muszę się zgodzić z Silverfish. Doceniam twoją odpowiedź, ale nie odnosi się ona do mojego centralnego punktu, z tego powodu, dla którego Silverfish ogłosił. Gdybyśmy mieli N = 1 000 000, to prawie jakakolwiek różnica byłaby znacząca w ustawieniu standardowym. Ale w przypadku non-inferiority tak nie jest. Nawet w wersji dwustronnej TOST tak nie jest. Jeśli różnica jest mniejsza niż kwota, którą uważamy za ważną, to żaden N nie sprawi, że będzie to oznaczać.
Peter Flom
1
Przepraszam - mój pierwszy komentarz miał być jedynie wstępem do drugiego (a dokładniej drugi był przepełnieniem pierwszego!) I nie miał na celu podniesienia własnego punktu wolnostojącego. Link był pomocny, dzięki. Twój centralny punkt (który bardzo ładnie umieściłeś, zarówno w odpowiedzi, jak i w przekreśleniu) jasno wyjaśnia, dlaczego nie zgadzasz się z wnioskiem Piotra . Byłem jednak ciekawy, gdzie według ciebie wada tkwi w jego logice - a może w jej założeniu . To jest to, co według mnie nie zostało rozwiązane bezpośrednio.
Silverfish,