Wyobraź sobie, że musisz sporządzać raporty dotyczące liczby kandydatów, którzy co roku przystępują do danego testu. Wydaje się raczej trudno wnioskować o obserwowanym% sukcesu, na przykład w odniesieniu do szerszej populacji ze względu na specyfikę populacji docelowej. Możesz więc wziąć pod uwagę, że dane te reprezentują całą populację.
Czy wyniki testów wskazują, że proporcje mężczyzn i kobiet są różne naprawdę prawdziwe? Czy test porównujący zaobserwowane i teoretyczne proporcje wydaje się poprawny, skoro bierze się pod uwagę całą populację (a nie próbkę)?
W rzeczywistości, jeśli naprawdę masz pewność, że masz całą populację, nawet nie ma potrzeby wchodzenia w statystyki. Wiesz dokładnie, jak duża jest różnica, i nie ma już powodu, aby ją testować. Klasycznym błędem jest wykorzystanie istotności statystycznej jako istotności „istotnej”. Jeśli próbka populacji, różnica jest taka, jaka jest.
Z drugiej strony, jeśli przeformułujesz swoją hipotezę, kandydaci mogą być postrzegani jako próbka możliwych kandydatów, co pozwoliłoby na testowanie statystyczne. W takim przypadku sprawdziłbyś ogólnie, czy mężczyzna i kobieta różnią się w danym teście.
Jak powiedział ars, możesz użyć testów z wielu lat i dodać czas jako czynnik losowy. Ale jeśli naprawdę interesują Cię różnice między tymi kandydatami w tym konkretnym teście, nie możesz użyć uogólnienia, a testowanie jest bezsensowne.
źródło
Tradycyjnie wnioskowanie statystyczne jest nauczane w kontekście próbek prawdopodobieństwa i charakteru błędu próbkowania. Ten model jest podstawą testu istotności. Istnieją jednak inne sposoby modelowania systematycznych odstępstw od przypadku i okazuje się, że nasze testy parametryczne (oparte na próbkowaniu) są zwykle dobrym przybliżeniem tych alternatyw.
Testy parametryczne hipotez opierają się na teorii próbkowania w celu oszacowania prawdopodobnego błędu. Jeśli próbka o danym rozmiarze zostanie pobrana z populacji, znajomość systematycznego charakteru próbkowania sprawia, że badania i przedziały ufności mają znaczenie. W przypadku populacji teoria pobierania próbek jest po prostu nieistotna, a testy nie mają znaczenia w tradycyjnym znaczeniu. Wnioskowanie jest bezużyteczne, nie ma co do tego wnioskować, jest tylko rzecz… sam parametr.
Niektórzy omijają to, odwołując się do super-populacji, które reprezentuje obecny spis. Uważam te apele za nieprzekonujące - testy parametryczne opierają się na próbkowaniu prawdopodobieństwa i jego cechach. Populacja w danym czasie może być próbką większej populacji w czasie i miejscu. Nie widzę jednak żadnego sposobu, aby można było słusznie argumentować, że jest to próbka losowa (lub bardziej ogólnie dowolna forma prawdopodobieństwa). Bez próbki prawdopodobieństwa teoria próbkowania i tradycyjna logika testowania po prostu nie mają zastosowania. Równie dobrze możesz przetestować na podstawie próbki wygody.
Oczywiście, aby zaakceptować testowanie przy użyciu populacji, musimy zrezygnować z podstawy tych testów w procedurach pobierania próbek. Jednym ze sposobów na to jest rozpoznanie ścisłego związku między naszymi testami teoretycznymi na próbce - takimi jak t, Z i F - a procedurami randomizacji. Testy randomizacyjne opierają się na dostępnej próbce. Jeśli zbieram dane o dochodach mężczyzn i kobiet, modelem prawdopodobieństwa i podstawą naszych oszacowań błędu są powtarzane losowe alokacje rzeczywistych wartości danych. Mógłbym porównać zaobserwowane różnice między grupami z rozkładem opartym na tej randomizacji. (Nawiasem mówiąc, robimy to cały czas w eksperymentach, w których losowe pobieranie próbek z modelu populacji rzadko jest odpowiednie).
Okazuje się, że testy teoretyczne są często dobrym przybliżeniem testów randomizacyjnych. Tak więc ostatecznie uważam, że testy z populacji są przydatne i znaczące w tych ramach i mogą pomóc odróżnić systematyczne od zmienności szans - tak jak w przypadku testów opartych na próbach. Logika zastosowana w tym celu jest nieco inna, ale nie ma to większego wpływu na praktyczne znaczenie i wykorzystanie testów. Oczywiście lepiej byłoby po prostu bezpośrednio zastosować testy randomizacji i permutacji, ponieważ są one łatwo dostępne przy użyciu całej naszej nowoczesnej mocy obliczeniowej.
źródło
Załóżmy, że wyniki wskazują, że kandydaci różnią się w zależności od płci. Na przykład odsetek osób, które ukończyły testy, jest następujący: 40% kobiet i 60% mężczyzn. Aby zasugerować oczywiste, 40% różni się od 60%. Teraz ważne jest, aby zdecydować: 1) interesująca cię populacja; 2) jak twoje obserwacje odnoszą się do interesującej populacji. Oto kilka szczegółów na temat tych dwóch problemów:
Jeśli interesująca Cię populacja to tylko obserwowani przez ciebie kandydaci (np. 100 kandydatów, którzy złożyli podanie na uniwersytet w 2016 r.), Nie musisz zgłaszać statystycznych testów istotności. Wynika to z tego, że twoja populacja była całkowicie próbkowana ... liczy się tylko 100 kandydatów, na których masz pełne dane. Oznacza to, że 60% to kropka, inna niż 40%. Pytanie to brzmi: czy w populacji liczącej 100 osób występowały różnice między płciami, które dotyczyły programu? To pytanie opisowe, a odpowiedź brzmi „tak”.
Jednak wiele ważnych pytań dotyczy tego, co stanie się w różnych ustawieniach. Oznacza to, że wielu badaczy chce wymyślić trendy dotyczące przeszłości, które pomogą nam przewidzieć (a następnie zaplanować) przyszłość. Przykładowym pytaniem w tym względzie byłoby: Jak prawdopodobne są przyszłe testy kandydatów, które będą się różnić w zależności od płci? Populacja będąca przedmiotem zainteresowania jest wówczas szersza niż w scenariuszu nr 1 powyżej. W tym momencie ważnym pytaniem jest: czy zaobserwowane dane mogą reprezentować przyszłe trendy? To pytanie wnioskowe i na podstawie informacji dostarczonych z oryginalnego plakatu odpowiedź brzmi: nie wiemy.
Podsumowując, raportowane statystyki zależą od rodzaju pytania, na które chcesz odpowiedzieć.
Najbardziej pomocne może być myślenie o podstawowych projektach badawczych (spróbuj tutaj: http://www.socialresearchmethods.net/kb/design.php ). Myślenie o superpopulacjach może być pomocne, jeśli potrzebujesz bardziej zaawansowanych informacji (tutaj jest artykuł, który może pomóc: http://projecteuclid.org/euclid.ss/1023798999#ui-tabs-1 ).
źródło
Jeśli weźmiesz pod uwagę, że wszystko, co mierzysz, jest procesem losowym, wówczas testy statystyczne są odpowiednie. Weźmy na przykład rzut monetą 10 razy, aby sprawdzić, czy jest uczciwa. Dostajesz 6 głów i 4 ogony - co wnioskujesz?
źródło