Co się stanie, jeśli weźmiesz losową próbkę i zobaczysz, że nie jest ona reprezentatywna, jak w ostatnim pytaniu . Na przykład, co jeśli rozkład populacji ma być symetryczny wokół zera, a losowana próbka ma niezrównoważone obserwacje dodatnie i ujemne, a brak równowagi jest statystycznie znaczący, gdzie to Cię pozostawia? Jakie rozsądne stwierdzenia na temat populacji można sformułować na podstawie stronniczej próby? Jaki jest rozsądny sposób postępowania w takiej sytuacji? Czy ma to znaczenie, gdy w naszych badaniach zauważamy tę nierównowagę?
sampling
experiment-design
inference
sample
Joel W.
źródło
źródło
Odpowiedzi:
Odpowiedź udzielona przez MLS (próbkowanie znaczenie stosowania) jest tylko tak dobry jak założeniach można zrobić o swoich rozkładów. Główną zaletą skończonego paradygmatu próbkowania populacji jest to, że jest nieparametryczny, ponieważ nie przyjmuje żadnych założeń dotyczących rozkładu danych w celu wnioskowania (ważnych) wniosków na temat skończonych parametrów populacji.
Nazywa się podejście do korygowania nierównowagi próbek post stratyfikacją . Musisz rozbić próbkę na niezachodzące na siebie klasy (po warstwach), a następnie ponownie zważyć te klasy zgodnie ze znanymi liczbami populacji. Jeśli wiadomo, że twoja populacja ma medianę 0, możesz ponownie zważyć pozytywne i negatywne obserwacje, aby ich ważone proporcje stały się 50-50: jeśli miałbyś pechowego SRS z 10 negatywnymi obserwacjami i 20 pozytywnymi obserwacjami, dałbyś negatywne o wadze 15/10 = 1,5 i pozytywne o 15/20 = 0,75.
Istnieją bardziej subtelne formy kalibracji próbki , w których można skalibrować próbkę w celu spełnienia bardziej ogólnych ograniczeń, takich jak średnia zmiennej ciągłej równa określonej wartości. Ograniczenie symetrii jest dość trudne w obsłudze, chociaż może być również wykonalne. Być może Jean Opsomer ma coś na ten temat: wykonuje wiele prac związanych z szacowaniem jądra dla danych ankietowych.
źródło
Jestem Junior Member tutaj, ale powiedziałbym, że odrzucając i zaczyna od nowa zawsze jest najlepszą odpowiedzią, czy ty wiesz , że próbka jest znacznie niereprezentatywne, a jeśli masz pomysł, w jaki sposób będą reprezentatywne próbkowanie powstały w pierwszej kolejności i jak tego uniknąć, jeśli to możliwe za drugim razem.
Co dobrego zrobi próbka po raz drugi, jeśli prawdopodobnie skończysz na tej samej łodzi?
Jeśli ponowne gromadzenie danych nie ma sensu lub jest nadmiernie kosztowne, musisz pracować z tym, co masz, próbując zrekompensować niereprezentatywność poprzez stratyfikację, przypisywanie, bardziej wyszukane modelowanie lub cokolwiek innego. Musisz wyraźnie zauważyć, że zrekompensowałeś sobie w ten sposób, dlaczego uważasz, że jest to konieczne i dlaczego uważasz, że zadziałało. Następnie przeanalizuj niepewność, która pojawiła się w wyniku kompensacji. (To sprawi, że twoje wnioski będą mniej pewne, prawda?)
Jeśli nie możesz tego zrobić, musisz całkowicie upuścić projekt.
źródło
źródło