Czy mogę zastosować sparowany test t, gdy próbki są normalnie rozmieszczone, ale ich różnica nie jest?

12

Mam dane z eksperymentu, w którym zastosowałem dwa różne zabiegi w identycznych warunkach początkowych, w wyniku czego otrzymałem liczbę całkowitą od 0 do 500 w każdym przypadku. Chcę użyć sparowanego testu t, aby ustalić, czy efekty wywołane dwoma zabiegami są znacząco różne. Wyniki dla każdej grupy leczenia są zwykle rozkładane, ale różnica między każdą parą nie jest zwykle rozkładana (asymetryczna + jeden długi ogon).

Czy mogę w tym przypadku zastosować sparowany test t, czy też naruszono założenie normalności, co oznacza, że ​​powinienem zastosować test nieparametryczny?

John Doucette
źródło
Eksperyment opiera się na symulacji. Mogę dowolnie ustawić początkowe warunki symulacji. Dlatego dla każdej pary zaczynam od tych samych warunków początkowych i stosuję dwa różne algorytmy.
John Doucette,
Z tego, co opisujesz, brzmi to jak niezależne grupy. Czy zastosowałeś oba zabiegi do każdego przypadku, czy jest jakieś inne dopasowanie? Jaka jest korelacja między warunkami? Twoje sformułowanie jest dziwne ... czy masz na myśli, że masz jedną wartość w ogonie, co czyni ją asymetryczną?
Jan
Myśląc o tym dalej, jestem mniej pewien, że są zależni, ale być może możesz rzucić na to trochę światła. Analogiczna korelacja w prawdziwym świecie brzmiałaby: mam osobę. Podaje się leczenie pierwsze i wykonuje się pomiar. Potem cofam czas i zamiast tego przeprowadzam leczenie dwa. Ponownie wykonuje się pomiar. Wydaje mi się, że te środki należy uznać za skorelowane. Może nie powinni?
John Doucette,
Ponadto, w przypadku nienormalności, rozkład jest zarówno asymetryczny, jak i ma jeden długi ogon (z wieloma wartościami odstającymi). Usunięcie niektórych wartości odstających nie uczyniłoby tego normalnym.
John Doucette,
3
Jeśli rozkłady jednowymiarowe są normalne i niezależne, wówczas rozkład różnic musi być normalny. Brak normalności świadczy o zależności między tymi dwoma rozkładami. Zależność ta polega nie tylko na korelacji: musi być coś jeszcze.
whuber

Odpowiedzi:

13

Sparowany test t analizuje tylko listę sparowanych różnic i zakłada, że ​​próbka wartości jest losowo próbkowana z populacji Gaussa. Jeżeli założenie to zostanie rażąco naruszone, sparowany test t jest nieważny. Rozkład, z którego próbki przed i po są próbkami, jest nieistotny - tylko populacja różnic jest próbkowana z materii.

Harvey Motulsky
źródło
Powiedzmy, że jeśli przeanalizuję model nieliniowy i wygeneruję y_observed at time = i. Czy mogę wykonać sparowany test t, który porównuje każdą zaobserwowaną wartość z faktyczną wartością w czasie i? Załóżmy również, że mam obserwowane dane dla 100 przedziałów czasowych i prognozuję moje liczby na te same przedziały
dassouki,