Jestem ciekawy, czy istnieje transformacja, która zmienia pochylenie zmiennej losowej bez wpływu na kurtozę. Byłoby to analogiczne do tego, jak afiniczna transformacja RV wpływa na średnią i wariancję, ale nie na pochylenie i kurtozę (częściowo dlatego, że pochylenie i kurtoza są zdefiniowane jako niezmienne dla zmian skali). Czy to znany problem?
data-transformation
random-variable
moments
shabbychef
źródło
źródło
Odpowiedzi:
Moja odpowiedź to początek totalnego włamania, ale nie znam żadnego ustalonego sposobu robienia tego, o co prosisz.
Moim pierwszym krokiem byłoby uporządkowanie zestawu danych, aby znaleźć proporcjonalną pozycję w zestawie danych, a następnie przekształcenie go w rozkład normalny. Metodę tę zastosowano w Reynolds i Hewitt, 1996. Zobacz przykładowy kod R poniżej w PROCMiracle.
Gdy rozkład jest normalny, problem został odwrócony - kwestia dostosowania kurtozy, ale nie przekrzywienia. Wyszukiwarka google zasugerowała, że można zastosować procedury John & Draper, 1980, aby dostosować kurtozę, ale nie przekrzywienie - ale nie mogłem powtórzyć tego wyniku.
Moje próby opracowania prymitywnej funkcji rozprzestrzeniania / zwężania, która przyjmuje wartość wejściową (znormalizowaną) i dodaje lub odejmuje wartość od niej proporcjonalną do położenia zmiennej w normalnej skali, powoduje monotoniczną korektę, ale w praktyce ma tendencję do tworzenia rozkład bimodalny, chociaż taki, który ma pożądane wartości skośności i kurtozy.
Zdaję sobie sprawę, że nie jest to pełna odpowiedź, ale pomyślałem, że może to stanowić krok we właściwym kierunku.
źródło
Inna możliwa interesująca technika, jaka nasuwa się na myśl, choć nie do końca odpowiada na to pytanie, polega na przekształceniu próbki w ustaloną próbkę L-skosu i próbki L-kurtozy (a także stałą średnią i skalę L). Te cztery ograniczenia są liniowe w statystykach zamówień. Utrzymanie transformacji monotonicznej na próbce obserwacji wymagałoby następnie innych równań . Można to uznać za kwadratowy problem optymalizacji: zminimalizujn n−1 ℓ2 norma między statystyką zamówienia próbki a wersją przekształconą, z zastrzeżeniem podanych ograniczeń. Jest to jednak trochę zwariowane podejście. W pierwotnym pytaniu szukałem czegoś bardziej podstawowego i fundamentalnego. Ja również domyślnie szukałem techniki, która mogłaby być zastosowana do indywidualnych obserwacji, niezależnie od posiadania całej kohorty próbek.
źródło
Wolałbym modelować ten zestaw danych przy użyciu rozkładu leptokurtycznego zamiast transformacji danych. Lubię dystrybucję sinh-arcsinh od Jonesa i Pewseya (2009), Biometrika.
źródło