Przeglądając artykuł, autorzy stwierdzają: „Ciągłe zmienne wyników wykazujące skośny rozkład zostały przekształcone przy użyciu logarytmów naturalnych, zanim przeprowadzono testy t w celu spełnienia wstępnych założeń normalności”.
Czy jest to akceptowalny sposób analizy danych nienormalnych, szczególnie jeśli rozkład podstawowy niekoniecznie jest logarytmiczny?
To może być bardzo głupie pytanie, ale nie widziałem tego wcześniej ...
Odpowiedzi:
Często próbuje się zastosować jakąś transformację do normalności (używając np. Logarytmów, pierwiastków kwadratowych, ...) w przypadku napotkania danych, które nie są normalne. Chociaż logarytm daje dość dobre wyniki dla wypaczonych danych dość często, nie ma gwarancji, że zadziała w tym konkretnym przypadku. Analizując przekształcone dane, należy również pamiętać o powyższym komentarzu @ whubers: „Test t dla logarytmów nie jest ani tym samym, co test t dla nietransformowanych danych ani test nieparametryczny. Test t na logach porównuje geometrię oznacza, a nie (zwykłe) środki arytmetyczne. ”
Zamiast wybierać transformację (np. Logarytmy), ponieważ działa ona przez większość czasu, wolę użyć procedury Box-Coxa do wyboru transformacji przy użyciu podanych danych. Istnieją jednak pewne filozoficzne problemy z tym; w szczególności, czy powinno to wpłynąć na liczbę stopni swobody w teście t, ponieważ wykorzystaliśmy pewne informacje z próbki przy wyborze transformacji do użycia.
Wreszcie dobrą alternatywą dla zastosowania testu t po transformacji lub klasycznego testu nieparametrycznego jest użycie analogu testu początkowego testu t. Nie wymaga założenia normalności i jest testem na nietransformowane środki (i nie na niczym innym).
źródło
Mówiąc ogólnie, jeżeli założenia wymagane do przeprowadzenia testu t nie są spełnione, bardziej odpowiednie byłoby zastosowanie testu nieparametrycznego.
źródło