Prowadzę badania nad grami edukacyjnymi, a niektóre z moich bieżących projektów polegają na wykorzystaniu danych z BoardGameGeek (BGG) i VideoGameGeek (VGG) w celu zbadania związków między elementami projektowania gier (tj. „Osadzonymi w II wojnie światowej”, „wymaga rzucania kostką” ) i oceny tych gier (tj. wyniki na 10). Każdy z tych elementów projektu odpowiada znacznikowi w systemie BGG lub VGG, więc każdy element jest zasadniczo zmienną dychotomiczną. Gra ma 1 za każdy znacznik obecny w bazie danych i 0 za każdy znacznik, który nie jest obecny.
Istnieją dziesiątki tych tagów, więc chcę użyć eksploracyjnej analizy czynnikowej (EFA), aby uzyskać możliwą do zarządzania liczbę „gatunków”, które wychwytują wzorce w projektowaniu gier. Korzystając z kilku źródeł, rozumiem, że ponieważ pracuję ze zmiennymi dychotomicznymi , powinienem stosować korelacje polichoryczne ( tetrachoryczne , szczególnie tutaj) zamiast Pearsona , kiedy wymyślam moje czynniki (są też inne opcje - takie jak analiza utajonej cechy - tam, ale na razie to ten, który eksploruję).
Z ciekawości wymyśliłem dwa zestawy czynników, jeden przy użyciu korelacji Pearsona, a drugi przy użyciu korelacji polichorycznych (za każdym razem ta sama liczba czynników). Mój problem polega na tym, że czynniki obliczone za pomocą korelacji Pearsona mają znacznie większy sens i są łatwiejsze do interpretacji niż czynniki obliczone za pomocą korelacji polichorycznych. Innymi słowy, „gatunki” z pierwszego zestawu czynników mają intuicyjny sens i odpowiadają mojemu zrozumieniu, w jaki sposób gry są zazwyczaj projektowane; tak nie jest w przypadku drugiego zestawu czynników.
Z jednej strony chcę się upewnić, że spełniam założenia testów, których używam, nawet jeśli dzięki temu moje wyniki będą mniej ładne. Z drugiej strony czuję, że częścią celu analizy czynnikowej i (szerzej) budowania modelu jest wymyślenie czegoś użytecznego, a bardziej przydatne informacje pojawiają się, gdy „łamię zasady”. Czy potrzeba użytecznego modelu wystarcza, by przeważyć naruszenie założeń tego testu? Jakie są konsekwencje używania korelacji Pearsona zamiast polichorycznych?
źródło
Odpowiedzi:
Analiza współczynnika liniowego jest teoretycznie logiczna tylko dla zmiennych ciągłych . Jeśli zmienne nie są ciągłe, ale są na przykład dychotomiczne, jednym ze sposobów jest przyznanie się do leżących u podstaw zmiennych ciągłych i zadeklarowanie, że obserwowane zmienne są binarne lub prawdziwe. Nie można kwantyfikować zmiennej dychotomicznej w skali bez zewnętrznego „opiekuna”, ale nadal można wywnioskować korelacje, które byłyby, gdyby wasze zmienne nie zostały jeszcze podzielone na bin i byłyby „oryginalne” ciągłe normalnie rozłożone. I to jest tetrachorycznekorelacje (lub polichoryczne, jeśli zamiast binarnych masz zmienne porządkowe). Tak więc stosowanie korelacji tetrachorycznych (wywnioskowane korelacje Pearsona) zamiast korelacji Phi (obserwowane korelacje Pearsona z dychotomicznymi danymi) jest aktem logicznym.
Korelacje Phi obliczone na dychotomicznie skumulowanych zmiennych są bardzo wrażliwe na punkt odcięcia (inaczej „poziom trudności zadania”), nad którym miało miejsce binowanie. Para zmiennych może mieć nadzieję, że osiągnie teoretyczną granicę tylko wtedy, gdy zostaną one skumulowane względem równoważnego punktu odcięcia. Im bardziej różny był w nich punkt odcięcia, tym niższa jest maksymalna granica możliwego pomiędzy nimi. (Jest to ogólny wpływ identyczności rozkładów krańcowych na możliwy zakres dla Pearsonar = 1 r r , ale w zmiennych dychotomicznych efekt ten jest najbardziej wyraźny, ponieważ zbyt mało wartości do przyjęcia.) Tak więc korelacje phi w ich macierzy mogą być postrzegane jako nierówno deflowane z powodu kontrastujących rozkładów marginalnych w zmiennych dychotomicznych; nie wiesz, czy jedna „korelacja” jest większa od drugiej „naprawdę”, czy z powodu różnych punktów odcięcia w tych dwóch parach zmiennych. Liczba czynników do wyodrębnienia (zgodnie z takimi kryteriami, jak „wartość własna Kaisera> 1”) zostanie zawyżona: niektóre wyodrębnione „czynniki” będące wynikiem nierówności, różnorodności punktów odcięcia, - nie istotne czynniki ukryte. Jest to praktyczny powód, dla którego nie należy używać korelacji phi (przynajmniej w postaci surowej - nieskalowanej).
W badaniach symulacyjnych / binowaniu udowodniono, że analiza czynnikowa oparta na korelacjach tetrachorycznych pogarsza się, jeśli w macierzy występuje wiele silnych (> 0,7) korelacji. Korelacja tetrachoryczna nie jest idealna: jeśli punkty odcięcia korelujących zmiennych podstawowych znajdują się w przeciwieństwach (a zatem rozkłady krańcowe w dychotomii są przeciwnie wypaczone), podczas gdy powiązanie podstawowe jest silne, współczynnik tetrachoryczny jeszcze bardziej go przecenia. Należy również zauważyć, że macierz korelacji tetrachorycznej niekoniecznie musi być dodatnim półprzewodnikiem w niezbyt dużych próbkach i dlatego może wymagać korekty („wygładzania”). Mimo to jest uważany przez wielu za lepszy sposób niż analiza czynnikowa na prostych współczynnikach Pearsona (phi).
Ale dlaczego w ogóle przeprowadzana jest analiza czynnikowa danych binarnych? Istnieją inne opcje, w tym cecha ukryta / IRT (forma analizy czynników „logistycznych”) i analiza wielokrotnej korespondencji (jeśli widzisz swoje zmienne binarne jako kategorie nominalne).
Zobacz też:
źródło