Jaka jest Twoja intuicja / interpretacja rozkładu wartości własnych macierzy korelacji? Słyszę, że zwykle 3 największe wartości własne są najważniejsze, a te bliskie zeru to hałas. Widziałem także kilka prac badawczych, w których badano, jak naturalnie występujące rozkłady wartości własnych różnią się od tych obliczonych z macierzy korelacji losowej (ponownie, odróżniając szum od sygnału).
Zachęcamy do rozwinięcia swoich spostrzeżeń.
distributions
correlation
Eduardas
źródło
źródło
Odpowiedzi:
Słyszę, że zwykle 3 największe wartości własne są najważniejsze, a te bliskie zeru to hałas
Możesz to sprawdzić. Zobacz artykuł w tym poście, aby uzyskać więcej szczegółów. Ponownie, jeśli masz do czynienia z szeregami razy finansowych, możesz najpierw skorygować o leptokurtyczność (tj. Rozważ serię zwrotów skorygowanych pod względem skali, a nie surowych).
Widziałem kilka prac badawczych badających, jak naturalnie występujące rozkłady wartości własnych różnią się od tych obliczonych na podstawie macierzy korelacji losowej (ponownie, odróżniając szum od sygnału).
Edward:> Zazwyczaj robi się to w drugą stronę: spójrz na wielowymiarowy rozkład wartości własnych (macierzy korelacji) pochodzących z żądanej aplikacji. Po zidentyfikowaniu wiarygodnego kandydata do dystrybucji wartości własnych, wygenerowanie na ich podstawie powinno być dość łatwe.
Najlepsza procedura określania rozkładu wielowymiarowego wartości własnych zależy od liczby zasobów, które chcesz rozważyć jednocześnie (tj. Jakie są wymiary macierzy korelacji). Jest ładna sztuczka, jeśli ( jest liczbą zasobów).pp ≤ 10 p
Edytuj (komentarze Shabbychef)
czteroetapowa procedura:
Ograniczeniem jest to, że szybkie obliczenia wypukłego kadłuba serii punktów stają się wyjątkowo wolne, gdy liczba wymiarów jest większa niż 10.jot≥ 2
źródło
Wartości własne określają wielkości podstawowych składników rozproszenia danych.
(źródło: yaroslavvb.com )
Pierwszy zestaw danych został wygenerowany z Gaussa z macierzą kowariancji drugi zestaw danych to pierwszy zestaw danych obrócony o
źródło
Jednym ze sposobów, w jaki badałem ten problem w przeszłości, jest skonstruowanie „portfeli własnych” macierzy korelacji. Oznacza to, że weź wektor własny związany z tą największą wartością własną macierzy korelacji i przeskaluj go do dźwigni brutto równej 1 (tj. Zrób bezwzględną sumę wektora równą jeden). Sprawdź, czy możesz znaleźć rzeczywiste fizyczne lub finansowe powiązanie między akcjami, które mają dużą reprezentację w portfelu.k
Zwykle pierwsze portfel własny ma prawie taką samą wagę pod każdą nazwą, to znaczy portfel „rynkowy” obejmujący wszystkie aktywa o równej wadze dolara. Drugie portfolio własne może mieć znaczenie semantyczne, w zależności od okresu, na który patrzysz: np. Głównie zapasów energii lub zapasów bankowych itp. Z mojego doświadczenia trudno byłoby stworzyć jakąkolwiek historię z piątego portfela własnego lub poza nim, i to zależy w pewnym stopniu od wyboru wszechświata i rozważanego okresu. Jest to w porządku, ponieważ zwykle piąta wartość własna nie jest zbyt daleko poza granicami narzuconymi przez rozkład Marchenko-Pastura.
źródło
Każda wartość twoich zmiennych określa punkt w przestrzeni wymiarowej. Ta chmura punktów jest często podobna do elipsoidy (jeśli nie jest, to nie powinieneś uważać zmiennych za liniowo powiązane, a korelacja nie znaczy wiele). Oś elipsoidy odpowiada wektorom własnym macierzy korelacji, a ich „siła” ich wartościom własnym. Dowód można znaleźć w dowolnym podręczniku analizy szeregów czasowych, który obejmuje analizę głównych składników. Luźna intuicja, dlaczego PCA lub inne metody oparte na wartości własnej mają znaczenie, jest taka, że masz jakiś proces, który ma pewne „główne” przyczyny, a reszta to „szum”.N N
źródło