Pobieranie próbek z wielowymiarowego rozkładu normalnego podlegającego kwadratowym ograniczeniom

Odpowiedzi:

12

Formalne rozwiązanie tego problemu wymaga najpierw właściwej definicji

Nd(μ,Σ) zastrzeżeniem, że ||x||2=1

Naturalnym sposobem jest zdefiniowanie rozkładu zależności od . I zastosować to warunkowo do przypadku . Jeśli użyjemy współrzędnych biegunowych , Jakobianem transformacji jest Dlatego gęstość warunkowa rozkładuXNd(μ,Σ)||X||=ϱϱ=1

x1=ϱcos(θ1)θ1[0,π]x2=ϱsin(θ1)cos(θ2)θ2[0,π]xd1=ϱ(i=1d2sin(θi))cos(θd1)θd1[0,2π]xd=ϱi=1d1sin(θi)
ϱd1i=1d2sin(θi)d1i
θ=(θ1,,θd1) Biorąc pod uwagę to ϱ
f(θ|ϱ)exp12{(x(θ,ϱ)μ)TΣ1(x(θ,ϱ)μ)}i=1d2sin(θi)d1i

Wniosek: Gęstość ta różni się od zwykłego zastosowania gęstości normalnej do punktu na sferze jednostkowej ze względu na jakobian.

Drugim krokiem jest rozważenie docelowej gęstości i zaprojektuj algorytm Monte Carlo łańcucha Markowa do badania przestrzeni parametrów . Moja pierwsza próba dotyczyłaby próbnika Gibbsa, zainicjowanego w punkcie na kuli najbliższej , czyli, i postępując pod jednym kątem na raz w sposób Metropolis w obrębie Gibbsa:

f(θ|ϱ=1)exp12{(x(θ,1)μ)TΣ1(x(θ,1)μ)}i=1d2sin(θi)d1i
[0,π]d2×[0,2π]μμ/||μ||
  1. Generuj (gdzie obliczane są sumy modulo ) i przyjmij tę nową wartość z prawdopodobieństwem elseθ1(t+1)U([θ1(t)δ1,θ1(t)+δ1])π
    f(θ1(t+1),θ2(t),...|ϱ=1)f(θ1(t),θ2(t),...|ϱ=1)1
    θ1(t+1)=θ1(t)
  2. Generuj (gdzie obliczane są sumy modulo ) i zaakceptuj tę nową wartość z prawdopodobieństwem elseθ2(t+1)U([θ2(t)δ2,θ2(t)+δ2])π
    f(θ1(t+1),θ2(t+1),θ3(t),...|ϱ=1)f(θ1(t+1),θ2(t),θ3(t),...|ϱ=1)1
    θ2(t+1)=θ2(t)
  3. Wygeneruj (gdzie sumy są obliczane modulo ) i przyjmuj tę nową wartość z prawdopodobieństwem elseθd1(t+1)U([θd1(t)δd1,θd1(t)+δd1])2π
    f(θ1(t+1),θ2(t+1),...,θd1(t+1)|ϱ=1)f(θ1(t+1),θ2(t+1),...,θd1(t)|ϱ=1)1
    θd1(t+1)=θd1(t)

Skale , , , mogą być skalowane względem współczynników akceptacji kroków, w celu osiągnięcia idealnego celu .δ1δ2δd150%

Oto kod R ilustrujący powyższe, z wartościami domyślnymi dla i :μΣ

library(mvtnorm)
d=4
target=function(the,mu=1:d,sigma=diag(1/(1:d))){
 carte=cos(the[1])
 for (i in 2:(d-1))
  carte=c(carte,prod(sin(the[1:(i-1)]))*cos(the[i]))
 carte=c(carte,prod(sin(the[1:(d-1)])))
 prod(sin(the)^((d-2):0))*dmvnorm(carte,mean=mu,sigma=sigma)}
#Gibbs
T=1e4
#starting point
mu=(1:d)
mup=mu/sqrt(sum(mu^2))
mut=acos(mup[1])
for (i in 2:(d-1))
  mut=c(mut,acos(mup[i]/prod(sin(mut))))
thes=matrix(mut,nrow=T,ncol=d-1,byrow=TRUE)
delta=rep(pi/2,d-1)     #scale
past=target(thes[1,])   #current target
for (t in 2:T){
 thes[t,]=thes[t-1,]
 for (j in 1:(d-1)){
   prop=thes[t,]
   prop[j]=prop[j]+runif(1,-delta[j],delta[j])
   prop[j]=prop[j]%%(2*pi-(j<d-1)*pi)
   prof=target(prop)
   if (runif(1)<prof/past){
     past=prof;thes[t,]=prop}
   }
}
Xi'an
źródło
-3

||x||22=1 nie jest ściśle możliwe, ponieważ jest (ciągłą) zmienną losową. Jeśli chcesz mieć wariancję 1, tj. (gdzie tylda oznacza, że ​​szacujemy wariancję), wtedy musisz wymagać, aby jej wariancja wynosiła . Jednak to żądanie może być sprzeczne z . To znaczy, aby pobrać próbki z tą wariancją, potrzebujesz przekątnej aby była równa .xE[(xμ)2]=~1n(xμ)2=1n||xn||22=1n1nΣΣ1n

Aby ogólnie próbkować z tego rozkładu, możesz wygenerować iid standardowe normalne, a następnie pomnożyć przez , pierwiastek kwadratowy z , a następnie dodać średnie .Σ0.5Σμ

yoki
źródło
Dzięki za twoją odpowiedź. Jednym ze sposobów, w jaki mogę o tym myśleć, jest produkowanie tego, czego chcę (ale nie jest to wydajne), próbkowania odrzucenia . Tak więc nie jest to niemożliwe. Ale szukam skutecznego sposobu na zrobienie tego.
Sobi