W przypadku niektórych pomiarów wyniki analizy są odpowiednio prezentowane w przekształconej skali. Jednak w większości przypadków pożądane jest przedstawienie wyników w oryginalnej skali pomiaru (w przeciwnym razie twoja praca będzie mniej lub bardziej bezwartościowa).
Na przykład w przypadku danych transformowanych logami pojawia się problem z interpretacją w oryginalnej skali, ponieważ średnia zarejestrowanych wartości nie jest logarytmem średniej. Przyjmowanie antylogarytmu oszacowania średniej w skali logarytmicznej nie daje oszacowania średniej w pierwotnej skali.
Jeśli jednak dane przekształcone w dziennik mają rozkład symetryczny, zachodzą następujące relacje (ponieważ dziennik zachowuje porządek):
(antylogarytm średniej wartości logarytmicznej jest medianą oryginalnej skali pomiarów).
Mogę więc jedynie wyciągać wnioski na temat różnicy (lub stosunku) median na oryginalnej skali pomiaru.
Dwupróbkowe testy t i przedziały ufności są najbardziej wiarygodne, jeśli populacje są w przybliżeniu normalne z przybliżonymi odchyleniami standardowymi, więc możemy ulec pokusie wykorzystania Box-Cox
transformacji do przyjęcia założenia normalności (uważam również, że jest to również transformacja stabilizująca wariancję ).
Jeśli jednak zastosujemy narzędzia t do Box-Cox
transformowanych danych, uzyskamy wnioski na temat różnicy w średnich transformowanych danych. Jak interpretować te na oryginalnej skali pomiaru? (Średnia z przekształconych wartości nie jest przekształconą średnią). Innymi słowy, biorąc odwrotną transformację oszacowania średniej, na przekształconej skali, nie daje oszacowania średniej na pierwotnej skali.
Czy w tym przypadku mogę również wyciągać wnioski na temat median? Czy istnieje transformacja, która pozwoli mi wrócić do środków (w oryginalnej skali)?
To pytanie zostało pierwotnie opublikowane jako komentarz tutaj
źródło
Jeśli transformacja Box-Coxa daje rozkład symetryczny, wówczas średnia z transformowanych danych jest przekształcana z powrotem do mediany w oryginalnej skali. Dotyczy to każdej transformacji monotonicznej, w tym transformacji Boxa-Coxa, transformacji IHS itp. Tak więc wnioski na temat średnich na przekształconych danych odpowiadają wnioskom na temat mediany w oryginalnej skali.
Ponieważ oryginalne dane były wypaczone (inaczej nie użyłbyś transformacji Box-Coxa), dlaczego chcesz wnioskować na temat średnich? Myślałem, że praca z medianami miałaby w tej sytuacji większy sens. Nie rozumiem, dlaczego jest to postrzegane jako „problem z interpretacją w oryginalnej skali”.
źródło
Jeśli chcesz wnioskować o środkach w oryginalnej skali, możesz rozważyć użycie wnioskowania, które nie wykorzystuje założenia normalności.
Uważaj jednak. Po prostu podłączenie poprzez proste porównanie środków poprzez powiedzmy resampling (testy permutacji lub ładowanie początkowe), gdy dwie próbki mają różne wariancje, może stanowić problem, jeśli w analizie założono, że wariancje są równe (a równe wariancje na przekształconej skali będą wariancjami różnic w oryginalnej skali, jeśli średnie różnią się). Takie techniki nie unikają konieczności myślenia o tym, co robisz.
-
Najłatwiejszym przypadkiem jest normalność w skali logarytmicznej, a zatem lognormalna w oryginalnej skali. Jeśli znana jest Twoja wariancja (co w najlepszym wypadku zdarza się bardzo rzadko), możesz skonstruować logarytmiczne CI i PI w oryginalnej skali i możesz podać przewidywaną średnią ze średniej rozkładu odpowiedniej wielkości.
Musisz bardzo dokładnie przemyśleć, na jakie pytanie próbujesz odpowiedzieć.
źródło