Dlaczego nazwy typu Błąd 1, 2?

21

Jaka jest motywacja do wprowadzenia dodatkowego poziomu pośredniczości od opisowego „fałszywie dodatniego” do liczby całkowitej „1”? Czy „fałszywie pozytywne” jest naprawdę zbyt długie?

Vorac
źródło
10
Jestem z tobą, to okropne imię. Korzystam z każdej okazji, aby z niego nie korzystać.
Matthew Drury,
5
Podobnie. Nigdy nie pamiętałem, który był, dopóki nie usłyszałem tego niezwykle pomocnego sposobu rozróżnienia ich ... W historii Chłopca, który płakał wilka wieśniacy najpierw popełniają błąd typu 1 , a drugi raz popełniają błąd typu 2 .
Sam
1
@Sam Pamiętam je jak w „ Pierwszą rzeczą, jaką badacz robi po odkryciu efektu, jest publikacja”. Ale w prawym okienku znajduje się link do pytania z 84 opiniami, jak je zapamiętać.
Vorac
Zawsze uważam, że „fałszywie pozytywny” i „fałszywie negatywny” jest bardzo zagmatwany. W medycynie „pozytywny” odnosi się do „posiadania stanu” (co jest już mylące i jest źródłem wielu żartów), ale jakiego rodzaju (statystyczny) test służy do ustalenia, czy masz stan? Jest pozytywny, mając warunek równy odrzuconemu testowi na zdrowie (np. Testom na zdrowy poziom niektórych składników, np. Żelaza we krwi), czy jest równy nieodrzuconemu testowi H 0 na chorobę (np. Testy dla markerów wskazujących na chorobę, stan lub coś w rodzaju ciąży)? H0H0
Sextus Empiricus

Odpowiedzi:

21

Świetne pytanie, zmotywowało mnie do Google :) Na Wikipedię (z drobnymi zmianami formatowania):

Błąd typu I (lub błąd pierwszego rodzaju) to nieprawidłowe odrzucenie prawdziwej hipotezy zerowej.

Błąd typu II (lub błąd drugiego rodzaju) to brak odrzucenia fałszywej hipotezy zerowej.

W dalszej części strony omawia etymologię:

W 1928 r. Jerzy Neyman (1894–1981) i Egon Pearson (1895–1980), obaj wybitni statystycy, omawiali problemy związane z „decydowaniem, czy dana próbka może zostać uznana za przypadkowo pobraną z określonej populacji „...

„... w testowaniu hipotez należy wziąć pod uwagę dwa względy, (1) musimy być w stanie zmniejszyć szansę odrzucenia prawdziwej hipotezy do tak niskiej wartości, jak to pożądane; (2) test musi być tak opracowany, aby odrzuci testowaną hipotezę, gdy może być fałszywa ”.

H1H2

„... [i] te błędy będą dwojakiego rodzaju:

  • H0
  • H0HAH1

    W tym samym artykule nazywają te dwa źródła błędów, odpowiednio błędy typu I i błędy typu II.

  • Wygląda więc na to, że pierwszy rodzaj błędu był oparty na oryginalnej pracy Fishera nad testami istotności. Drugi rodzaj błędu opierał się na rozszerzeniu pracy Fishera przez Neymana i Pearsona, a mianowicie na wprowadzeniu alternatywnej hipotezy, a tym samym jej testowania. Zobacz tutaj po więcej szczegółów.

    Wydaje się, że kolejność, w jakiej wykryto tego rodzaju błędy, odpowiada ich liczbie, podanej przez Neymana i Pearsona.

    ilanman
    źródło
    1
    Powody historyczne - nic dziwnego. Podobnie jak <-makra podstawiania tekstu R i C ++. Dziękuję za odpowiedź na moje słabo zbadane pytanie. I dzięki @gung za miłą edycję pytania.
    Vorac,
    3
    Czy „porządek, w którym o tym myśleli” nie był pod silnym wpływem wcześniejszej pracy Fishera? tzn. dopóki Neyman i Pearson nie przedstawili idei alternatywnej hipotezy, istniał tylko jeden „typ” błędu (odrzucenie H_0, gdy jest to prawda). Wraz z H_A pojawia się możliwość wystąpienia błędu „drugiego typu”.
    steeldriver
    Jestem pewien, że tak było.
    ilanman
    Jednym drobnym punktem, który warto dodać, jest to, że artykuł z 1928 r. „Wykorzystanie i interpretacja niektórych kryteriów testowych do celów wnioskowania statystycznego” nie definiuje jeszcze różnych źródeł błędów jako błędów „typu I” i „typu II” (zamiast tego mówi o typie uporządkowanym w odniesieniu do dystrybucji Pearson). To w 1933 roku Neyman i Pearson zdefiniowali go jako typ I i ​​typ II.
    Sextus Empiricus
    Dobrze byłoby również wyprostować cytat z poprawnymi odniesieniami. Lub przynajmniej pierwszy cytat „... w testowaniu hipotez dwa względy ...” nie jest dosłownie z artykułu z 1928 roku.
    Sextus Empiricus