Rozkład próbkowania promienia rozkładu normalnego 2D

11

Dwuwymiarowy rozkład normalny ze średnią i macierzą kowariancji można ponownie zapisać we współrzędnych biegunowych o promieniu kącie . Moje pytanie brzmi: jaki jest rozkład próbkowania , to znaczy odległość od punktu do szacowanego środka danej macierzy kowariancji próbki ?μΣrθr^xx¯S

Tło: Rzeczywista odległość od punktu oznacza, że zgodne z rozkładem Hoyta . W przypadku wartości własnych z i parametr parametru kształtu to , a jego parametrem skali jest . Wiadomo, że funkcja skumulowanego rozkładu jest różnicą symetryczną między dwiema funkcjami Q Marcum.rxμλ1,λ2Σλ1>λ2q=1(λ1+λ2)/λ2)1ω=λ1+λ2

Symulacja sugeruje, że podłączenie szacunków i dla i do prawdziwego cdf działa dla dużych próbek, ale nie dla małych próbek. Poniższy schemat pokazuje wyniki z 200 razyx¯SμΣ

  • symulacja 20 wektorów normalnych 2D dla każdej kombinacji podanych ( oś), (wiersze) i kwantyl (kolumny)qxω
  • dla każdej próbki, obliczając podany kwantyl obserwowanego promienia dor^x¯
  • Dla każdej próbki, obliczanie kwantylu od teoretycznej Hoyt (2D normalny) CDF, od teoretycznego Rayleigha CDF po podłączeniu Przykładowe wartości szacunkowych a .x¯S

wprowadź opis zdjęcia tutaj

Gdy zbliża się do 1 (rozkład staje się kołowy), oszacowane kwantyle Hoyta zbliżają się do oszacowanych kwantyli Rayleigha, na które nie ma wpływu . Wraz ze wzrostem rośnie różnica między kwantylami empirycznymi a kwantylami szacowanymi, szczególnie w ogonie rozkładu.qqω

karakal
źródło
1
Jakie jest pytanie?
Jan
@John Podkreśliłem pytanie: „Jaki jest rozkład próbkowania [promień] , to znaczy odległość od punktu do szacowanego środka biorąc pod uwagę macierz konwariancji próbki ?” rxx¯S
caracal
Dlaczego w przeciwieństwie do ? r^r2^
SomeEE
@MathEE po prostu dlatego, że znana mi literatura dotyczy dystrybucji (true) , a nie (true) . Zauważ, że nie jest to sytuacja, w której odległość Mahalanobis omówiona w tym pytaniu . Oczywiście bardzo mile widziane byłyby wyniki dystrybucji . r^rr2r^2
caracal

Odpowiedzi:

7

Jak wspomniałeś w swoim poście, znamy rozkład oszacowania jeśli otrzymamy więc znamy rozkład oszacowania prawdziwego .rtrue^μrtrue2^r2

Chcemy znaleźć rozkład gdzie są wyrażone jako wektory kolumnowe.

r2^=1Ni=1N(xix¯)T(xix¯)
xi

Teraz wykonujemy standardową lewę

rtrue2^=1Ni=1N(xiμ)T(xiμ)=1Ni=1N(xix¯+x¯μ)T(xix¯+x¯μ)=[1Ni=1N(xix¯)T(xix¯)]+(x¯μ)T(x¯μ)(1)=r2^+(x¯μ)T(x¯μ)
gdzie wynika z równania i jego transpozycja.(1)
1Ni=1N(xix¯)T(x¯μ)=(x¯x¯)T(x¯μ)=0

Zauważ, że jest śladem przykładowej macierzy kowariancji i zależy tylko od średniej próbki . Tak więc zapisaliśmy jako suma dwóch niezależne zmienne losowe. Znamy rozkłady i i dlatego wykonujemy standardową sztuczkę przy użyciu tego funkcje charakterystyczne są multiplikatywne.r2^S(x¯μ)T(x¯μ)x¯

rtrue2^=r2^+(x¯μ)T(x¯μ)
rtrue2^(x¯μ)T(x¯μ)

Edytowano, aby dodać:

||xiμ||jest Hoyt, więc ma pdf gdzie to zmodyfikowana funkcja Bessela pierwszego rodzaju .

f(ρ)=1+q2qωρe(1+q2)24q2ωρ2IO(1q44q2ωρ2)
I00th

Oznacza to, że pdf to ||xiμ||2

f(ρ)=121+q2qωe(1+q2)24q2ωρI0(1q44q2ωρ).

Aby ułatwić oznaczenie ustawione , i .a=1q44q2ωb=(1+q2)24q2ωc=121+q2qω

Funkcja generująca moment to ||xiμ||2

{c(sb)2a2(sb)>a0 else

Tak więc funkcją generującą moment jest a funkcja generowania momentu is rtrue2^

{cN((s/Nb)2a2)N/2(s/Nb)>a0else
||x¯μ||2
{Nc(sNb)2(Na)2=c(s/Nb)2a2(s/Nb)>a0 else

Oznacza to, że funkcją generującą moment w jest r2^

{cN1((s/Nb)2a2)(N1)/2(s/Nb)>a0 else.

Zastosowanie odwrotnej transformaty Laplace'a daje, że ma pdf r2^

g(ρ)=πNcN1Γ(N12)(2iaNρ)(2N)/2ebNρJN/21(iaNρ).
SomeEE
źródło
Dziękuję Ci! Będę musiał ustalić szczegóły przed zaakceptowaniem.
caracal
rtrue2^Hoyt i ? Zatem funkcja charakterystyczna jest iloczynem dwóch charakterystycznych funkcji, jak wyjaśniono tutaj . To rzeczywiście odpowiada na moje pytanie. Czy wiesz, jak możemy odpowiednio przekształcić tak aby jego dystrybucja była znana bez dostępu do ? Jak odległości Mahalanobisa, albo jednoczynnikowej statystyki? ||x¯μ||2N(0,1NΣ)r2^r2^Σt
caracal
Zredagowałem swoją odpowiedź na pełną odpowiedź. Daj mi znać, jeśli się zgadzasz.
SomeEE
Nie jestem pewien nieznanego . Oczywistą rzeczą do zrobienia jest próba „podzielenia” przez przykładową kowariancję która wyglądałaby jak suma odległości Mahalanobisa, tzn. Należy rozważyć . Niestety suma ta wynosi zawsze . Σr2^S1Ni=1N(xix¯)TS1(xix¯)1
SomeEE
Dziękujemy za kontynuowanie pracy nad odpowiedzią! Nie jestem pewien co do rozkładu . Nie m żeby do czynienia z tym analitycznie, a szybkie symulacja daje różny rozkład niż : R Kod symulacji . Chociaż może być tak, że nie rozumiem poprawnie parametryzacji . r 2 Γ ( q , ω||xiμ||2r2ΓΓ(q,ωq)Γ
caracal