Załóżmy, że mam zmienną, której rozkład jest wypaczony w bardzo dużym stopniu pozytywnie, tak że pobranie logu nie będzie wystarczające, aby umieścić go w zakresie skośności dla rozkładu normalnego. Jakie są moje opcje w tym momencie? Co mogę zrobić, aby przekształcić zmienną w rozkład normalny?
data-transformation
skewness
histelheim
źródło
źródło
Odpowiedzi:
Wypróbuj prostą transformację Box-Cox zgodnie z Box, GEP i Cox, DR (1964), „An Analysis of Transformations”, Journal of the Royal Statistics Society, Series B , 26, 211--234. SAS ma opis swojej funkcji wiarygodności w normalizujących transformacjach , której można użyć do znalezienia optymalnego parametru , co opisano w Atkinson, AC (1985), Plots, Transformations and Regression , New York: Oxford University Press.λ
Bardzo łatwo jest zaimplementować go za pomocą funkcji LL lub jeśli masz pakiet statystyk, taki jak SAS lub MATLAB, użyj ich poleceń: jest to polecenie boxcox w MATLAB i PROC TRANSREG w SAS.
Również w R jest to w pakiecie MASS, funkcja boxcox ().
źródło
W przypadku pochylenia dodatniego (ogon znajduje się na dodatnim końcu osi x), istnieje transformacja pierwiastka kwadratowego, transformacja logarytmiczna i transformacja odwrotna / odwrotna (w kolejności rosnącego nasilenia). Dlatego jeśli transformacja dziennika nie jest wystarczająca, możesz użyć następnego poziomu transformacji. Box Cox uruchamia wszystkie transformacje automatycznie, dzięki czemu możesz wybrać najlepszą.
źródło
Większość pakietów oprogramowania będzie używać numeru Eulera jako domyślnej bazy logów, AKA: log naturalny. Możesz użyć wyższej liczby bazowej, aby ograniczyć nadmiernie skośne dane. To, jak to zrobisz, pod względem składniowym, zależy od używanego oprogramowania.
Jeśli musisz odzyskać swoje przekształcone wartości po dokonaniu oszacowań, może być nieco łatwiej skorzystać z tej metody, ponieważ wszystko, co musisz zrobić, to wykonać operator wykładniczy na zmiennej bez względu na bazę danych dziennika.
źródło