Transformacja liniowa zmiennej losowej przez wysoką prostokątną macierz

12

XRnfX(x)n×nAY=AXY

fY(y)=1|detA|fX(A1y).

Powiedzmy teraz, że przekształcamy zamiast macierzy macierzy , z , dając . Wyraźnie , ale „żyje” w wymiarowej podprzestrzeni . Jaka jest gęstość warunkowa , skoro wiemy, że leży ona w ?Xm×nBm>nZ=BXZRmnGRmZG

Moim pierwszym odruchem było użyć pseudo-odwrotność . Jeżeli jest pojedyncza wartość rozkładu , następnie jest pseudo-odwrotny, w którym jest utworzony poprzez odwrócenie niezerowe wpisy przekątnej macierzy . Domyślam się, że dałoby to gdzie przez mam na myśli iloczyn niezerowych wartości pojedynczych.BB=USVTBB+=VS+UTS+S

fZ(z)=1|det+S|fX(B+z),
det+S

To rozumowanie zgadza się z gęstością pojedynczej normy (uwarunkowanej wiedzą, że zmienna żyje w odpowiedniej podprzestrzeni) podaną tutaj i wspomnianą również tutaj i w tym poście z potwierdzonym krzyżem .

Ale to nie w porządku! Stała normalizacji jest wyłączona. Podany jest (trywialny) kontrprzykład, biorąc pod uwagę następujący przypadek: W , niech Tutaj macierz z góry jest tylko wektorem jedności. Jego pseudo-odwrotność to i . Powyższe rozumowanie sugeruje, że ale tak naprawdę integruje się (na linii ) zXN(0,1)

Y=(11)X=(XX).
B
B+=(1/21/2)
det+B=2
fY(y)=12π2exp(12yT(B+)TB+y),
y=x12. Zdaję sobie sprawę, że w tym przypadku możesz po prostu usunąć jeden z wpisów , gotowe, ale gdy jest znacznie większy, identyfikowanie zestawu wpisów do usunięcia jest denerwujące. Dlaczego pseudo-odwrotne rozumowanie nie działa? Czy istnieje ogólny wzór na funkcję gęstości liniowej transformacji zbioru zmiennych losowych za pomocą macierzy „wysokiej”? Wszelkie odniesienia byłyby również mile widziane.YB
Dan
źródło

Odpowiedzi:

2

Dla tych, którzy mogą się z tym spotkać w przyszłości ... źródło błędu faktycznie wynika z integracji. W powyższym przykładzie integracja odbywa się ponad linią . Dlatego konieczne jest „sparametryzowanie” linii i wzięcie pod uwagę jakobianu parametryzacji przy przyjmowaniu całki, ponieważ każdy krok jednostkowy w osi odpowiada krokom długości na linii. Parametryzacja, której domyślnie użyłem, została podana przez , innymi słowy, określając oba identyczne wpisy według wartości. Ma to Jacobian , co starannie anuluje się zy=xx2x(x,x)y22 (pochodzący z dokładnie tego samego jakobiańskiego) w mianowniku.

Przykład był sztucznie prosty - dla ogólnej transformacji można uzyskać inną parametryzację wyjścia, która jest naturalna w kontekście problemu. Ponieważ parametryzacja musi obejmować tę samą podprzestrzeń co , a ta podprzestrzeń jest hiperpłaszczyzną, sama parametryzacja prawdopodobnie będzie liniowa. Wywołując reprezentację macierzy parametryzacji , wymaga się po prostu, aby miała taką samą przestrzeń kolumny jak (pokrywa tę samą hiperpłaszczyznę). Następnie końcowa gęstość staje sięBGBm×nLB

fZ(z)=|det+L||det+B|fX(B+z).

Ogólnie rzecz biorąc, ta konfiguracja jest dość dziwna i myślę, że właściwą rzeczą jest znalezienie maksymalnego liniowo niezależnego zestawu wierszy i usunięcie pozostałej części wierszy (wraz z odpowiednimi składnikami przekształconej zmiennej ), aby uzyskać macierzy kwadratowej . Następnie problem sprowadza się do przypadku pełnego rzędu (przy założeniu, że ma pełny stopień kolumny).BzB^n×nB

Dan
źródło