Uczę podstawowego kursu statystycznego i dziś obejmę test niezależności chi-kwadrat dla dwóch kategorii oraz test jednorodności. Te dwa scenariusze są koncepcyjnie różne, ale mogą wykorzystywać tę samą statystykę testową i rozkład. W teście jednorodności zakłada się, że krańcowe wartości dla jednej z kategorii są częścią samego projektu - reprezentują liczbę osobników wybranych dla każdej grupy eksperymentalnej. Ponieważ jednak test chi-kwadrat obraca się wokół warunkowania na wszystkich wartościach krańcowych, nie ma matematycznych konsekwencji rozróżnienia między testami jednorodności a testami niezależności z danymi kategorycznymi - przynajmniej nie, gdy stosuje się ten test.
Moje pytanie jest następujące: czy istnieje jakaś szkoła myśli statystycznej lub podejścia statystycznego, która dałaby różne analizy, w zależności od tego, czy testujemy niezależność (gdzie wszystkie marginesy są zmiennymi losowymi), czy test jednorodności (gdzie jeden zestaw marginesów jest określone przez projekt)?
W przypadku ciągłym powiedz, gdzie obserwujemy na ten sam temat i sprawdź niezależność lub obserwuj w różnych populacjach i przetestować, czy pochodzą one z tego samego rozkładu, metoda jest inna (analiza korelacji vs test t). Co jeśli dane kategoryczne pochodzą z dyskretnych zmiennych ciągłych? Czy testy niezależności i jednorodności powinny być nie do odróżnienia?
Odpowiedzi:
Musisz po prostu zadać sobie pytanie: „Jak napisać hipotezę zerową?”. Zastanów się2 × k Tabela awaryjności częstotliwości niektórych zachowań (t / n) wśród wielu k grupy. Traktując pierwszą grupę jako odniesienie, maszk - 1 iloraz szans (θja, i = 1 , 2 , … , k - 1 ), które opisują związek między częstotliwością a grupą.
Pod niezależnością, jak w przypadku jednorodności, zakładasz, że wszystkie iloraz szans wynosi 1. Oznacza to, że prawdopodobieństwo odpowiedzi „tak” na warunek jest równie prawdopodobne bez względu na przydział grupy. Jeśli te założenia zawiodą, co najmniej jedna grupa jest inna.
Test ten można przeprowadzić za pomocą testu chi-kwadrat Pearsona z wykorzystaniem obserwowanych / oczekiwanych częstotliwości, który jest testem punktowym dla modelu regresji logistycznej dostosowującym się dok - 1 zmienne wskaźnikowe dla członkostwa w grupie. Tak strukturalnie możemy powiedzieć, że te testy są takie same.
Różnice pojawiają się jednak, gdy weźmiemy pod uwagę charakter czynnika grupującego. W tym sensie ważne jest kontekstowe zastosowanie testu, a raczej jego nazwa. Grupa może bezpośrednio przyczyniać się do wyniku, takiego jak obecność lub brak wzoru genu lub allelu cechy, w którym to przypadku, odrzucając wartość zerową, dochodzimy do wniosku, że wynik zależy od rozpatrywanego czynnika grupującego.
Z drugiej strony, gdy testujemy jednorodność, zwalniamy się z dokonywania jakichkolwiek przyczynowych założeń. Tak więc, gdy „grupa” jest wyrafinowanym konstruktem, takim jak rasa (która powoduje i jest spowodowana uwarunkowaniami genetycznymi, behawioralnymi i społeczno-ekonomicznymi), możemy wyciągnąć wnioski, takie jak: „mniejszości rasowo-etniczne doświadczają różnic mieszkaniowych, o czym świadczy heterogeniczność wskaźnika deprywacji sąsiedztwa” . Jeśli ktoś odparł taki argument, mówiąc: „cóż, to dlatego, że mniejszości osiągają niższe wykształcenie, zarabiają niższe dochody i zyskują mniej zatrudnienia”, można powiedzieć: „Nie twierdziłem, że ich rasa spowodowała takie rzeczy, po prostu że jeśli spojrzysz podczas wyścigu możesz przewidywać ich stan życia. ”
W ten sposób testy zależności są szczególnym przypadkiem testów jednorodności, w których możliwy wpływ czynników czających się jest interesujący i należy się nim zająć w analizie warstwowej. Użycie dopasowania wielowymiarowego w analogicznym modelu regresji logistycznej osiąga coś takiego i nadal możemy powiedzieć, że przeprowadzamy test zależności, ale niekoniecznie jednorodności.
źródło
Istnieje wyraźna różnica między tymi dwoma problemami, jeśli zamodelujesz je w sposób bayesowski. W niektórych pracach pierwszy przypadek (jednorodność) nazywa się próbkowaniem z „ustalonym jednym marginesem”, a drugi przypadek (niezależność) jako „ustalony całkowity stół”. Spójrz na przykład na Casella i in. (JASA 2009) .
Pracuję nad tym tematem, ale mój artykuł - który również opisuje to rozróżnienie - nie został jeszcze opublikowany :)
źródło