Jak poprawnie traktować wiele punktów danych dla każdego przedmiotu

10

Obecnie spieram się z kimś, jak prawidłowo traktować dane za pomocą wielu pomiarów dla każdego przedmiotu. W tym przypadku zebrano dane dla każdego podmiotu w krótkim czasie dla różnych warunków dla każdego podmiotu. Wszystkie pomiary gromadzą dokładnie tę samą zmienną, tylko wielokrotność.

Jedną z opcji jest teraz grupowanie danych według warunków i nie dbanie o to, że wiele punktów danych pochodzi od jednego podmiotu. Jednak punkty danych od każdego podmiotu prawdopodobnie nie są całkowicie niezależne.

Inną alternatywą jest, aby najpierw wziąć średnią wszystkich pomiarów dla każdego warunku od każdego pacjenta, a następnie porównać średnie. Prawdopodobnie wpłynie to jednak na znaczenie, ponieważ w końcowej analizie nie bierze się pod uwagę, że w środkach występuje mniej błędów.

Jak poprawnie analizować takie dane? Czy to w jakiś sposób rozwiązano w SPSS? Zasadniczo powinno być możliwe obliczenie marginesu błędu przy obliczaniu średniej i rozważenie tego w końcowej analizie, ale nie sądzę, że SPSS w jakiś sposób wykonuje te obliczenia za moimi plecami.

LiKao
źródło
1
Czy jest to projekt z powtarzanymi pomiarami, tak aby każdy badany działał we wszystkich lub w wielu warunkach? A może to tylko niezależne grupy lub miary, w których każdy przedmiot jest w jednym stanie?
John
W tym projekcie każdy przedmiot działa we wszystkich warunkach. Istnieją jednak pewne punkty danych, które należy odrzucić, ponieważ badani nie wykonali danego zadania. Jest mało prawdopodobne, że podmiot zakończy się niepowodzeniem we wszystkich podzadaniach dla jednego warunku (istnieje około 40 powtórzeń na warunek), więc najprawdopodobniej każdy podmiot będzie miał punkty danych dla wszystkich warunków.
LiKao

Odpowiedzi:

9

Byłoby naruszeniem niezależności „grupować dane według warunków i nie dbać o to, że wiele punktów danych pochodzi od jednego podmiotu”. Więc nie ma mowy. Jednym z podejść jest „pobranie średniej wszystkich pomiarów dla każdego stanu od każdego pacjenta, a następnie porównanie średnich”. Możesz to zrobić w ten sposób, nie naruszysz niezależności, ale tracisz trochę informacji w agregacji do środków na poziomie przedmiotu.

Na pierwszy rzut oka brzmi to jak mieszany projekt z warunkami między podmiotami i wieloma okresami mierzonymi wśród podmiotów. Rodzi to jednak pytanie, dlaczego zbierałeś dane w wielu punktach czasowych? Czy oczekuje się, że wpływ czasu lub postęp zmiennej w czasie będzie różny w zależności od warunków? Jeśli odpowiedź na którekolwiek z tych pytań brzmi „tak”, to biorąc pod uwagę strukturę danych, oczekiwałbym, że interesuje Cię mieszana ANOVA. Mieszana ANOVA podzieli wariancję przedmiotu z SSTotal „za twoimi plecami”. Ale to, czy podział na partię pomoże ci między testami warunków zależy od kilku innych czynników.

W każdym razie w SPSS / PASW 18 Przeanalizuj -> Ogólny model liniowy -> Powtarzane miary. Będziesz miał jeden wiersz dla każdego tematu i jedną kolumnę dla każdego punktu czasowego, a także jeden jako identyfikator warunków. Identyfikator warunku przejdzie do sekcji „pomiędzy”, a powtarzane miary zostaną wykonane po zdefiniowaniu współczynnika powtarzanych miar.

russellpierce
źródło
Ok, tak myślałem. Wiele punktów danych na warunek jest gromadzonych z dwóch powodów. Jednym z nich jest to, że dane powinny być w ten sposób bardziej wiarygodne. Innym powodem jest to, że niektóre punkty danych należy odrzucić (badani przez cały czas nie postępowali zgodnie z instrukcjami). Warunki są całkowicie w obrębie przedmiotów, więc w tym przypadku w ogóle nie mamy mieszanego projektu. Niestety powtórzenie pomiaru nie wchodzi w rachubę, ponieważ mamy około 40 powtórzeń na warunek w każdym temacie. Duża liczba powtórzeń oznacza jednak, że tracimy wiele informacji, gdy używamy średnich.
LiKao
Potem polecam odpowiedź Johna. Preferowany jest model mieszany. To może modelować zarówno średnią, jak i zmienność w obrębie każdego przedmiotu i szanować zagnieżdżenie. Jednym z problemów związanych z taką analizą jest to, że „prawidłowe” stopnie swobody są niejasne, a zatem progi istotności statystycznej są również niejasne. W przeciwieństwie do kodu dostarczonego przez Johna, zaleciłbym dopasowanie losowego nachylenia dla efektu warunku (różne podmioty wyświetlają różne efekty). Widziałem niektóre symulacje, które sugerują, że tego nie zrobisz, mogą podnieść poziom błędu Typu I.
russellpierce
4

Jak wspomina drknexus, projekt wielokrotnych pomiarów jest tradycyjnym sposobem radzenia sobie z tym. Wykonując tego rodzaju analizę, należy agregować do jednego wyniku / warunku / tematu. Jest wrażliwy na naruszenia założeń sferyczności i inne problemy. Jednak bardziej nowoczesną techniką jest stosowanie modelowania wielopoziomowego lub liniowych efektów mieszanych. Korzystając z tej techniki, nie agregujesz danych. Dostępnych jest kilka metod leczenia, ale obecnie nie znam najlepszego podstawowego samouczka. Baayen (2008) Rozdział 7 jest dobry. Pinheiro & Bates (2000) jest bardzo dobry, ale z dźwięków rzeczy postępuj zgodnie z ich radami we wstępie i czytaj fragmenty zalecane dla początkujących.

Jeśli chcesz tylko uzyskać wynik w stylu ANOVA, zakładając, że wszystkie twoje dane są w długim formacie (jedna linia / punkt danych) i masz kolumny wskazujące temat, odpowiedź (y) i zmienną warunkową (x), możesz spróbować patrząc na coś takiego w R (upewnij się, że pakiet lme4 jest zainstalowany).

library(lme4)
dat <- read.table('myGreatData.txt', header = TRUE)
m <- lmer( y ~ x + (1|subject), data = dat)
summary(m)
anova(m)

Oczywiście możesz mieć wiele innych zmiennych kolumn, być może współdziałających. Następnie możesz zmienić polecenie lmer na coś takiego jak ...

m <- lmer( y ~ x1 * x2 + (1|subject), data = dat)

(BTW, uważam, że nie agregowanie w powtarzanych krokach w celu zwiększenia władzy jest formalnym błędem. Czy ktoś pamięta nazwę?)

Jan
źródło
Uważam, że błąd polegający na nieumiejętności agregowania i używania współczynnika df z liczby odpowiedzi zamiast liczby badanych stanowi naruszenie niezależności. Alternatywnie (myślę) można pomyśleć o wnioskowaniu na poziomie indywidualnych odpowiedzi na pytania dla ustalonego zestawu tematów.
russellpierce