Dostałem dane do analizy w celu zbadania wpływu leczenia na poziomy żelaza w czterech różnych punktach czasowych (przed leczeniem, dzień zakończenia leczenia, 4 tygodnie po leczeniu i 2-4 miesiące po leczeniu). Nie ma grupy kontrolnej. Chcą sprawdzić, czy występuje znaczny wzrost poziomu żelaza w każdym z 3 punktów czasowych po leczeniu do poziomu przed leczeniem (poziom wyjściowy). Jedenaście pacjentów miało poziomy wyjściowe, ale tylko 8 pacjentów miało pełne dane dla wszystkich 4 punktów czasowych ( = 11, 10, 9 i 8 dla każdego punktu czasowego). Mierzono nie tylko poziomy żelaza, ale w każdym punkcie czasowym wykonywano dwa inne pomiary laboratoryjne w celu porównania z poziomem wyjściowym.
Mam kilka pytań, jak to przeanalizować. Najpierw pomyślałem, że RM ANOVA będzie odpowiednia do analizy tych danych, ale martwiłem się o małą wielkość próby, utratę danych i nienormalny rozkład danych. Następnie rozważyłem porównanie każdej miary po leczeniu z wartością wyjściową za pomocą testów rangowanych znaków Wilcoxona, ale potem wpadłem na problem wielu porównań. Przeczytałem jednak literaturę, że lekceważenie wymaga przeprowadzenia wielu porównań. Ogólnie rzecz biorąc, mam do czynienia z małymi rozmiarami próbek, niekompletnymi danymi i wieloma porównaniami (i czy jest to konieczne).
Mam nadzieję, że to wszystko miało sens. Jestem nowy w CrossValidated i zostałem tu skierowany przez kolegę jako miejsce do nauki od doświadczonych statystów, więc byłbym wdzięczny za wszelkie porady! Dzięki!
Edytowane w celu dodania surowych danych z komentarza:
Istnieją cztery całkowite punkty czasowe, a zmienna wynikowa jest ciągła. Na przykład wyniki w każdym punkcie czasowym wyglądają podobnie do tego:
Baseline (n=11): [2, 7, 7, 3, 6, 3, 2, 4, 4, 3, 14]
1st Post (n=10): [167, 200, 45, 132, ., 245, 199, 177, 134, 298, 111]
2nd Post (n=9): [75, 43, 23, 98, 87, ., 300, ., 118, 202, 156]
3rd Post (n=8): [23, 34, 98, 112, ., 200, ., 156, 54, 18, .]
Odpowiedzi:
Ponownie przemyślałem twój problem i znalazłem test Friedmana, który jest nieparametryczną wersją jednokierunkowej ANOVA z powtarzanymi pomiarami .
Mam nadzieję, że masz kilka podstawowych umiejętności
R
.Wykonaj test Test Friedmana ...
a następnie znajdź między grupami różnicę w nieparametrycznym teście post-hoc . Tutaj masz wszystkie możliwe porównania.
Jak widać, tylko linia bazowa (pierwszy punkt czasowy) różni się statystycznie od innych.
Mam nadzieję, że to Ci pomoże.
źródło
Jeśli nie znasz rozkładu poszczególnych zmian w czasie, nie możesz go zbliżyć do rozkładu różnic między pacjentami. Na przykład, jeśli masz 10 pacjentów z odpowiednimi poziomami żelaza (510,520, ..., 600) przed leczeniem i (520,530, ..., 610) po leczeniu, ANOVA Kruskala-Wallisa (lub inny podobny algorytm) będzie twierdził że nie ma znaczącej zmiany poziomu żelaza.
IMHO, bez grupy kontrolnej, najlepiej jest policzyć, ilu pacjentów zwiększyło poziom żelaza, a ilu go zmniejszyło, i przetestować jego znaczenie.
To powiedziawszy, jeśli KW ANOVA mówi ci, że istnieje znaczny poziom żelaza, jest to (brak fałszywych trafień).
źródło