Testy takie jak Z, t i kilka innych zakładają, że dane są oparte na losowym próbkowaniu. Dlaczego?
Załóżmy, że prowadzę badania eksperymentalne, w których bardziej zależy mi na wewnętrznej ważności niż na zewnętrznej. Tak więc, jeśli moja próbka może być nieco stronnicza, to dobrze, ponieważ zgodziłem się nie wywnioskować hipotezy dla całej populacji. Grupowanie będzie nadal losowe, tzn. Dla wygody wybiorę przykładowych uczestników, ale losowo przydzielę ich do różnych grup.
Dlaczego nie mogę po prostu zignorować tego założenia?
Odpowiedzi:
Jeśli nie wnioskujesz w odniesieniu do szerszej grupy niż rzeczywista próba, wówczas nie ma zastosowania testów statystycznych i nie pojawia się pytanie o „stronniczość”. W takim przypadku wystarczy obliczyć statystyki opisowe próbki, które są znane. Podobnie, w tym przypadku nie ma mowy o „poprawności” modelu - po prostu obserwujesz zmienne i rejestrujesz ich wartości oraz opisy aspektów tych wartości.
Gdy zdecydujesz się wyjść poza próbę i wyciągnąć wnioski na temat większej grupy, będziesz potrzebować statystyk i będziesz musiał wziąć pod uwagę takie kwestie, jak stronniczość próbkowania itp. W tej aplikacji losowe próbkowanie staje się użyteczną właściwością, która pomaga uzyskać wiarygodność wnioski szerszej grupy zainteresowań. Jeśli nie masz losowego próbkowania (i nie znasz prawdopodobieństwa swoich próbek w oparciu o populację), trudno jest / nie jest możliwe wiarygodne wnioskowanie na temat populacji.
źródło
W prawdziwych badaniach naukowych rzadko zdarza się, aby dane pochodziły z prawdziwego losowego próbkowania. Dane są prawie zawsze próbkami wygody. Wpływa to przede wszystkim na to, do jakiej populacji można uogólnić. To powiedziawszy, nawet jeśli były one próbką wygody, pochodzą skądś, musisz tylko jasno określić, gdzie i jakie ograniczenia. Jeśli naprawdę uważasz, że twoje dane nie są reprezentatywne dla niczego, to twoje badanie nie będzie opłacalne na żadnym poziomie, ale prawdopodobnie nie jest to prawdą 1 . Dlatego często uzasadnione jest rozważenie skądś pobranych próbek i zastosowanie tych standardowych testów, przynajmniej w zabezpieczonym lub kwalifikowanym sensie.
Istnieje jednak inna filozofia testowania, która dowodzi, że powinniśmy odejść od tych założeń i testów, które na nich polegają. Tukey był zwolennikiem tego. Zamiast tego większość badań eksperymentalnych uważa się (wewnętrznie) za prawidłową, ponieważ jednostki badawcze (np. Pacjenci) zostały losowo przydzielone do ramion. Biorąc to pod uwagę, możesz użyć testów permutacyjnych , które w większości zakładają, że randomizacja została wykonana poprawnie. Przeciwwskazaniem do zbytniego martwienia się o to jest to, że testy permutacji zazwyczaj wykazują to samo co odpowiadające im klasyczne testy i wymagają więcej pracy. Ponownie, standardowe testy mogą być dopuszczalne.
1. Aby uzyskać więcej informacji na ten temat, przeczytaj moją odpowiedź tutaj: Identyfikacja populacji i próbek w badaniu .
źródło
Testy takie jak Z, t i kilka innych opierają się na znanych rozkładach próbkowania odpowiednich statystyk. Te rozkłady próbkowania, jak ogólnie stosowane, są zdefiniowane dla statystyki obliczonej na podstawie losowej próbki.
Czasami może być możliwe opracowanie odpowiedniego rozkładu próbkowania dla prób losowych, ale na ogół prawdopodobnie nie jest to możliwe.
źródło