Mój kolega chce przeanalizować niektóre dane po przekształceniu zmiennej odpowiedzi przez podniesienie jej do potęgi (to znaczy ). i0,125
Nie czuję się z tym komfortowo, ale próbuję wyjaśnić, dlaczego. Nie mogę wymyślić żadnego mechanistycznego uzasadnienia tej transformacji. Nigdy wcześniej tego nie widziałem i martwię się, że być może podwyższa to poziom błędów typu I czy coś takiego - ale nie mam nic na poparcie tych obaw!
Ponadto mój kolega stwierdza, że te przekształcone modele przewyższają modele nietransformowane w porównaniu z AIC. Czy to samo w sobie uzasadnia jego użycie?
regression
data-transformation
aic
AndrewMacDonald
źródło
źródło
Odpowiedzi:
Powszechną praktyką jest stosowanie transformacji mocy (Tukey, Box-Cox) z dowolnymi wartościami w odpowiedzi. Z tej perspektywy nie widzę szczególnej troski o twoją wartość 1/8 - jeśli ta transformacja daje ci dobre resztki, idź.
Oczywiście, każda transformacja zmienia zależność funkcjonalną, którą pasujesz, i może być tak, że 1/8 nie ma mechanistycznego sensu, ale nie byłoby to dla mnie problemem, gdy celem nie jest ekstrapolacja lub dopasowanie parametrów fizycznych prawo, ale aby uzyskać odpowiednią wartość p na znaku efektu (argumentowałbym, że to normalny przypadek użycia w regresji). W tym celu jedynym problemem jest to, że funkcja pasuje do danych w dziedzinie wartości predyktorów (wrt średnia i zmienność resztkowa) i łatwo ją sprawdzić.
Jeśli nie masz pewności co do najlepszej wartości transformacji mocy i chcesz porównać różne opcje, nie powinieneś bezpośrednio porównywać wartości AIC / prawdopodobieństwa, ponieważ transformacja mocy zmienia skalę odpowiedzi. Na szczęście okazuje się, że stosunkowo łatwo jest obliczyć poprawkę do transformacji, tak że różne transformacje można porównać na podstawie ich (skorygowanego) prawdopodobieństwa (patrz np. Tutaj ).
W R jest to zaimplementowane w MASS :: boxcox - jest to wygodny sposób na wybór właściwej wartości mocy.
źródło