Dlaczego kilka (jeśli nie wszystkie) testy hipotez parametrycznych zakładają losowe próbkowanie?

12

Testy takie jak Z, t i kilka innych zakładają, że dane są oparte na losowym próbkowaniu. Dlaczego?

Załóżmy, że prowadzę badania eksperymentalne, w których bardziej zależy mi na wewnętrznej ważności niż na zewnętrznej. Tak więc, jeśli moja próbka może być nieco stronnicza, to dobrze, ponieważ zgodziłem się nie wywnioskować hipotezy dla całej populacji. Grupowanie będzie nadal losowe, tzn. Dla wygody wybiorę przykładowych uczestników, ale losowo przydzielę ich do różnych grup.

Dlaczego nie mogę po prostu zignorować tego założenia?

Bruno
źródło
Jeśli technika próbkowania wprowadza błąd, to nie jest ona „losowa”. Jeśli nie wprowadza żadnego błędu, jest „losowy” (dla pewnej definicji losowej ;-). Miałem schematy próbkowania, które po prostu pobierały co 7 próbkę, aby utworzyć dopasowany rozmiar próbki do licznika. Wiedziałem jednak, że nie ma specjalnego aspektu tej selekcji, więc to, co można uznać za nieprzypadkowy proces próbkowania, było nadal skutecznie losowe. To tak samo, jak wybieranie piłek 1,2,3,4,5,6 na loterii. Jest tak samo losowy jak każda inna sekwencja.
Philip Oakley,
1
@ PhilipOakley: wybranie piłek 1,2,3,4,5,6 na loterii daje taką samą szansę na wygraną jak każda inna selekcja, ale zmniejsza oczekiwane wygrane, ponieważ istnieje większe prawdopodobieństwo, że będziesz musiał podzielić się nagrodą z innymi, którzy miał ten sam pomysł
Henry
1
Systematyczne pobieranie próbek, takie jak opisane przez @Philip, często jest analizowane tak, jakby tworzyło proste losowe próbki, ale ma pułapki. Na przykład, jeśli miałbyś mierzyć proces produkcyjny codziennie i pobierać próbki co siódmy pomiar, musiałbyś mylić swoje wyniki z efektem dnia tygodnia, ponieważ (oczywiście) pobierałbyś próbki tego samego dnia co tydzień. Musisz ciężko pracować, aby wymyślić takie subtelności i zająć się nimi w przypadku próbek nieprzypadkowych.
whuber
1
@whuber, oczywiście. Trzeba o tym mocno myśleć (i szeroko) !! W moim przypadku miałem godziny wideo, z setkami zdarzeń, z długimi przerwami między nimi, więc potrzebowałem zmniejszyć rozmiar danych zestawu nie-zdarzeń dla prostej regresji logistycznej (każda klatka rozpatrywana niezależnie, niewielka zmiana między klatkami), więc usunięcie wielu ramek nie będących zdarzeniami było rozsądne. Aspekt sekwencji czasowej rozpatrzono osobno.
Philip Oakley,
1
@Philip Co ciekawe, w tym samym czasie, kiedy pisałeś ten komentarz o przypadkowości, który nie istnieje, NIST wydała komunikat prasowy, w którym twierdzi, że tak jest . Konto pojawia się w dzisiejszym (4 kwietnia 2018 r.) Wydaniu Nature .
whuber

Odpowiedzi:

18

Jeśli nie wnioskujesz w odniesieniu do szerszej grupy niż rzeczywista próba, wówczas nie ma zastosowania testów statystycznych i nie pojawia się pytanie o „stronniczość”. W takim przypadku wystarczy obliczyć statystyki opisowe próbki, które są znane. Podobnie, w tym przypadku nie ma mowy o „poprawności” modelu - po prostu obserwujesz zmienne i rejestrujesz ich wartości oraz opisy aspektów tych wartości.

Gdy zdecydujesz się wyjść poza próbę i wyciągnąć wnioski na temat większej grupy, będziesz potrzebować statystyk i będziesz musiał wziąć pod uwagę takie kwestie, jak stronniczość próbkowania itp. W tej aplikacji losowe próbkowanie staje się użyteczną właściwością, która pomaga uzyskać wiarygodność wnioski szerszej grupy zainteresowań. Jeśli nie masz losowego próbkowania (i nie znasz prawdopodobieństwa swoich próbek w oparciu o populację), trudno jest / nie jest możliwe wiarygodne wnioskowanie na temat populacji.

Ben - Przywróć Monikę
źródło
5

W prawdziwych badaniach naukowych rzadko zdarza się, aby dane pochodziły z prawdziwego losowego próbkowania. Dane są prawie zawsze próbkami wygody. Wpływa to przede wszystkim na to, do jakiej populacji można uogólnić. To powiedziawszy, nawet jeśli były one próbką wygody, pochodzą skądś, musisz tylko jasno określić, gdzie i jakie ograniczenia. Jeśli naprawdę uważasz, że twoje dane nie są reprezentatywne dla niczego, to twoje badanie nie będzie opłacalne na żadnym poziomie, ale prawdopodobnie nie jest to prawdą 1 . Dlatego często uzasadnione jest rozważenie skądś pobranych próbek i zastosowanie tych standardowych testów, przynajmniej w zabezpieczonym lub kwalifikowanym sensie.

Istnieje jednak inna filozofia testowania, która dowodzi, że powinniśmy odejść od tych założeń i testów, które na nich polegają. Tukey był zwolennikiem tego. Zamiast tego większość badań eksperymentalnych uważa się (wewnętrznie) za prawidłową, ponieważ jednostki badawcze (np. Pacjenci) zostały losowo przydzielone do ramion. Biorąc to pod uwagę, możesz użyć testów permutacyjnych , które w większości zakładają, że randomizacja została wykonana poprawnie. Przeciwwskazaniem do zbytniego martwienia się o to jest to, że testy permutacji zazwyczaj wykazują to samo co odpowiadające im klasyczne testy i wymagają więcej pracy. Ponownie, standardowe testy mogą być dopuszczalne.

1. Aby uzyskać więcej informacji na ten temat, przeczytaj moją odpowiedź tutaj: Identyfikacja populacji i próbek w badaniu .

gung - Przywróć Monikę
źródło
3

Testy takie jak Z, t i kilka innych opierają się na znanych rozkładach próbkowania odpowiednich statystyk. Te rozkłady próbkowania, jak ogólnie stosowane, są zdefiniowane dla statystyki obliczonej na podstawie losowej próbki.

Czasami może być możliwe opracowanie odpowiedniego rozkładu próbkowania dla prób losowych, ale na ogół prawdopodobnie nie jest to możliwe.

Michael Lew
źródło