Zastanawiałem się, czy ktoś może mi pomóc z informacjami na temat Kurtozy (tj. Czy istnieje sposób na przekształcenie danych w celu ich zmniejszenia?)
Mam zestaw danych kwestionariusza z dużą liczbą przypadków i zmiennych. W przypadku niektórych moich zmiennych dane pokazują dość wysokie wartości kurtozy (tj. Rozkład leptokurtyczny), co wynika z faktu, że wielu uczestników dało dokładnie taki sam wynik dla zmiennej. Mam szczególnie dużą liczebność próby, więc zgodnie z centralnym twierdzeniem granicznym naruszenia normalności powinny być nadal w porządku.
Problemem jest jednak fakt, że szczególnie wysokie poziomy Kurtosis powodują szereg jednoznacznych wartości odstających w moim zbiorze danych. Jako taki, nawet jeśli przekształcę dane lub usunę / dopasuję wartości odstające, wysoki poziom kurtozy oznacza, że następne najbardziej ekstremalne wyniki automatycznie stają się wartościami odstającymi. Mam zamiar użyć (Analiza funkcji dyskryminacyjnej). Uważa się, że DFA jest odporny na odstępstwa od normalności, pod warunkiem że naruszenie jest spowodowane wypaczeniem, a nie wartościami odstającymi. Ponadto uważa się, że na DFA szczególnie wpływ mają odstające dane (Tabachnick i Fidel).
Jakieś pomysły na obejście tego? (Moja początkowa myśl była sposobem na kontrolowanie Kurtozy, ale czy to nie jest dobra rzecz, jeśli większość mojej próbki daje podobne oceny?)