Zadano mi to pytanie w wywiadzie.
Powiedzmy, że mamy macierz korelacji w postaci
Poproszono mnie o znalezienie wartości gamma, biorąc pod uwagę tę macierz korelacji.
Pomyślałem, że mogę coś zrobić z wartościami własnymi, ponieważ wszystkie powinny być większe lub równe 0. (Macierz powinna być dodatnia półfinałowa) - ale nie sądzę, że to podejście da odpowiedź. Brakuje mi sztuczki.
Czy możesz podać wskazówkę dotyczącą rozwiązania tego samego?
pearson-r
correlation-matrix
nowicjusz
źródło
źródło
Odpowiedzi:
Wiemy już, że jest ograniczona między Macierz korelacji powinna być dodatnia półfinałowa, a zatem jej główni nieletni powinni być nieujemni[ - 1 , 1 ]γ [−1,1]
Tak więc
źródło
Oto prostsze (i być może bardziej intuicyjne) rozwiązanie:
Pomyśl o kowariancji jako wewnętrznym produkcie nad abstrakcyjną przestrzenią wektorową . Następnie, wpisy w macierzy korelacji do wektorów v 1 , V, 2 , v 3 , w którym kątownik ⟨ v i , v j ⟩ oznacza kąt pomiędzy v ı i v j .sałata⟨ vja, vjot⟩ v1 v2) v3) ⟨ vja, vjot⟩ vja vjot
To nie jest trudne do wizualizacji, które jest ograniczony przez | ⟨ V 1 , V, 2 ⟩ ± ⟨ v 1 , v 3 ⟩ | . W związku z tym cosinus ( ) jest więc . Podstawowa trygonometria daje wtedy .⟨ v2), v3)⟩ | ⟨ v1, v2)⟩ ± ⟨ V1, v3)⟩ | γ sałata[ ⟨ V1, v2)⟩ ± ⟨ V1, v3)⟩ ] γ∈[0.6×0.8−0.6×0.8,0.6×0.8+0.6×0.8]=[0,0.96]
Edycja: Należy pamiętać, że w ostatnim wierszu jest naprawdę cos ⟨ v 1 , v 2 ⟩ cos ⟨ v 1 , v 3 ⟩ ∓ grzech ⟨ v 1 , v 3 ⟩ grzech ⟨ v 1 , v 2 ⟩ - drugie pojawienie się 0,6 i 0,8 następuje przypadkowo dzięki 0,6 2 + 0,8 2 = 10.6×0.8∓0.6×0.8 cos⟨v1,v2⟩cos⟨v1,v3⟩∓sin⟨v1,v3⟩sin⟨v1,v2⟩ 0.62+0.82=1 .
źródło
Oto, co miałem na myśli w moim początkowym komentarzu do odpowiedzi i co postrzegam @yangle może mówić (chociaż nie śledziłem / nie sprawdziłem ich obliczeń).
„Matryca powinna być dodatnia półfinałowa” oznacza, że wektory zmienne są wiązką w przestrzeni euklidesowej. Przypadek macierzy korelacji jest łatwiejszy niż macierzy kowariancji, ponieważ trzy długości wektorów są ustalone na 1. Wyobraź sobie 3 wektory jednostkowe XYZ i pamiętaj, że jest cosinus kąta . Zatem cos α = r x y = 0,6 , a cos β = r y z = 0,8 . Jakie mogą być granice dla cos γ = r x zr cosα=rxy=0.6 sałataβ= ryz= 0,8 sałataγ= rx z ? Korelacja ta może przyjmować dowolną wartość zdefiniowaną przez Z, opisującą Y (utrzymując przy tym kąt ):ryz=0.8
Gdy się obraca, dwie pozycje są niezwykłe jako ostateczne wrt X, obie mają miejsce, gdy Z wpada do płaszczyzny XY. Jeden znajduje się między X i Y, a drugi znajduje się po przeciwnej stronie Y. Są one pokazane przez wektory niebieskie i czerwone. W obu tych pozycjach dokładnie konfiguracja XYZ (macierz korelacji) jest pojedyncza. A są to minimalny i maksymalny kąt (stąd korelacja) Z może osiągnąć wrt X.
Wybierając wzór trygonometryczny w celu obliczenia sumy lub różnicy kątów na płaszczyźnie, mamy:
jako granice.cosγ=rxyryz∓(1−r2xy)(1−r2yz)−−−−−−−−−−−−−−√=[0,0.96]
Ten widok geometryczny jest kolejnym (a konkretnym i prostszym w przypadku 3D) spojrzeniem na to, co @rightskewed wyraził w kategoriach algebraicznych (nieletni itp.).
źródło
Zabawa z głównymi nieletnimi może być w porządku na problemach 3 na 3 lub 4 na 4, ale zabraknie gazu i stabilności liczbowej w wyższych wymiarach.
W przypadku pojedynczego problemu „wolnego” parametru, takiego jak ten, łatwo zauważyć, że zestaw wszystkich wartości tworzących psd macierzy będzie pojedynczym interwałem. Dlatego wystarczy znaleźć minimum i maksimum takich wartości. Można to łatwo osiągnąć, rozwiązując numerycznie parę problemów z liniowym programowaniem SemiDefinite (SDP):
Na przykład problemy te można formułować i rozwiązywać numerycznie, używając YALMIP w MATLAB.
Szybki, łatwy i niezawodny.
BTW, jeśli smarty ankieter spodni zadający pytanie, nie wie, że programowanie SemiDefinite, które jest dobrze rozwinięte i ma wyrafinowane i łatwe w użyciu optymalizatory numeryczne do niezawodnego rozwiązywania problemów praktycznych, może być użyte do rozwiązania tego problemu, i wiele więcej trudne warianty, powiedz mu, że to już nie 1870 rok, i czas skorzystać z nowoczesnych osiągnięć obliczeniowych.
źródło
Rozważmy następujący zestaw wypukły
Granicą eliptopu jest sześcienna powierzchnia określona przez
Zatem przecięcie eliptopu z dwiema płaszczyznami jest parametryzowanym segmentem linii
źródło
Każda dodatnia półokreślona macierz jest macierzą korelacji / kowariancji (i odwrotnie).
źródło