Chcę porównać dane proporcjonalne do trzech różnych grup, np .:
ID Group Prop.Nitrogen
1 A 0.89
2 A 0.85
3 B 0.92
4 B 0.97
Po Wharton i Hui (doi: 10.1890 / 10-0340.1 1 ) Myślałem, że lepiej byłoby, gdyby te dane były lepiej przetwarzane za pomocą transformacji logit.
Kiedy patrzę na wykresy diagnostyczne dla modeli liniowych na przekształconych i nieprzekształconych danych, wyglądają one bardzo podobnie bez żadnych oczywistych problemów i występują jedynie niewielkie różnice w szacowanych parametrach. Jednak nadal chciałbym móc powiedzieć coś o tym, jak dobrze model pasuje do przekształconych i nietransformowanych wersji danych - wiem, że nie mogę bezpośrednio porównywać wartości AIC. Czy jest jakaś korekta i mogę to sprawdzić? A może powinienem przyjąć inne podejście?
data-transformation
aic
fitting
David w
źródło
źródło
boxcox()
w bibliotece MASS), chociaż nie jestem pewien, czy poradzi sobie z transformacjami logit.boxcox()
dane surowe, czy dane przekształcone?Odpowiedzi:
Moje doświadczenie z transformowanymi danymi sugeruje, że korelacja poprawia się po transformacji, a także homoscedastyczność i / lub normalność, chociaż niekoniecznie wszystkie są optymalne dla każdej pojedynczej transformacji. Prostą odpowiedzią może być obliczenie współczynników korelacji między dwoma modelami i ich odpowiednimi zbiorami danych. Można nawet przetestować istotność różnicy skorelowanych współczynników korelacji. Testy typu homoscedastyczności i funkcji gęstości resztek mogą również stanowić sposób ich oceny.
źródło