Jeśli wygeneruję losową macierz symetryczną, jaka jest szansa, że ​​jest ona dodatnia?

32

Mam dziwne pytanie, kiedy eksperymentowałem z wypukłymi optymalizacjami. Pytanie brzmi:

Załóżmy, że losowo (powiedzmy standardowy rozkład normalny) generuję macierz symetryczną (na przykład generuję górną macierz trójkątną i wypełniam dolną połowę, aby upewnić się, że jest symetryczna), jaka jest szansa, że ​​jest to wartość dodatnia określona matryca? Czy w ogóle można obliczyć prawdopodobieństwo?N×N

Haitao Du
źródło
1
Spróbuj symulacji ...
kjetil b halvorsen
1
@kjetilbhalvorsen dzięki, ale zastanawiam się, jaka jest szansa, że ​​wszystkie wartości własne są większe niż 0. Czy możemy to zrobić nawet analitycznie.
Haitao Du
6
Odpowiedź zależy od tego , jak wygenerujesz macierz. Na przykład jeden sposób generuje rzeczywistych wartości własnych zgodnie z pewnym rozkładem, a następnie koniuguje tę diagonalną macierz z losową macierzą ortogonalną. Wynik będzie pozytywny, jeśli tylko te wszystkie wartości własne są pozytywne. Jeśli miałbyś generować wartości własne niezależnie zgodnie z rozkładem symetrycznym około zera , wówczas ta szansa oczywiście wynosi najwyżej . Aby wygenerować macierz PD, wybierz dobrze wartości własne! (W celu szybkiej pracy tworzę takie macierze, jak kowariancje wielowymiarowych danych normalnych.)n2n
whuber
11
Nie jest to odpowiedź na zadane pytanie, ale zwróć uwagę, że jeśli najpierw symulujesz macierz z każdym wpisem iid normalnym i tymi samymi wymiarami , to jest symetryczny i dodatni z prawdopodobieństwem 1.LNN=LLT
Cliff AB

Odpowiedzi:

41

Jeśli macierze są narysowane na podstawie standardowych iid pozycji iid, prawdopodobieństwo bycia zdefiniowanym dodatnio wynosi około , więc na przykład, jeśli , szansa wynosi 1/1000, i potem dość szybko spada. Obszerną dyskusję na to pytanie można znaleźć tutaj .pN3N2/4N=5

Możesz nieco zinterpretować tę odpowiedź, przyjmując, że rozkład wartości własnej macierzy będzie w przybliżeniu półkolem Wignera , który jest symetryczny względem zera. Gdyby wszystkie wartości własne były niezależne, miałbyś szansę na pozytywną definitywność dzięki tej logice. W rzeczywistości zachowuje się , zarówno z powodu korelacji między wartościami własnymi, jak i prawami rządzącymi dużymi odchyleniami wartości własnych, szczególnie najmniejszymi i największymi. W szczególności losowe wartości własne są bardzo podobne do naładowanych cząstek i nie lubią być blisko siebie, dlatego odpychają się nawzajem (wystarczająco dziwnie z tym samym polem potencjalnym co naładowane cząstki, , gdzie(1/2)NN21/rrto odległość między sąsiednimi wartościami własnymi). Proszenie ich o pozytywne nastawienie byłoby zatem bardzo wysoką prośbą.

Ponadto, z uwagi na prawa uniwersalności w teorii macierzy losowych, mocno podejrzewam, że powyższe prawdopodobieństwo będzie prawdopodobnie takie samo dla zasadniczo każdej „rozsądnej” macierzy losowej, z wejściami o średniej skończonej i odchyleniu standardowym.pN

Alex R.
źródło
5
Miło wiedzieć, że jest bardzo niska. Nie będę więc używał próbkowania odrzucania do tworzenia macierzy SPD w przyszłości.
Haitao Du
5
@ hxd1011: jeśli próbujesz próbkować matryce SPD, sugeruję metodę opisaną w powyższych komentarzach. Ponadto pomocne może być przeczytanie o rozkładach Choleskiego
Cliff AB
@CliffAB dzięki. Zwykle macierz SPD z macierzy kowariancji niektórych danych lub z podobną do tej, którą sugerujesz. Miałem czas, aby ręcznie wprowadzić niektóre liczby do małej macierzy, powiedzmy i mam nadzieję, że to macierz PD. AA2×2
Haitao Du