Konstrukcja dystrybucji Dirichleta z dystrybucją Gamma

18

Niech X1,,Xk+1 będą wzajemnie niezależnymi zmiennymi losowymi, z których każda ma rozkład gamma o parametrach αi,i=1,2,,k+1 pokazują, że Yi=XiX1++Xk+1,i=1,,k, mają wspólny podział jakoDirichlet(α1,α2,,αk;αk+1)

Wspólne pdf (X1,,Xk+1)=ei=1k+1xix1α11xk+1αk+11Γ(α1)Γ(α2)Γ(αk+1) Następnie, aby znaleźć wspólne pdf(Y1,,Yk+1)nie mogę znaleźć jakobiańskiego tj.J(x1,,xk+1y1,,yk+1)

Argha
źródło
3
Zajrzyj na strony 13-14 tego dokumentu .
@ Procrastinator Dziękuję bardzo, twój dokument jest najlepszą odpowiedzią na moje pytanie.
Argha,
2
@ Procrastinator - być może powinieneś odpowiedzieć na to pytanie, ponieważ OP jest z niego zadowolony i dodać kilka zdań, aby nie zadziałać ostrzeżenie „chcemy więcej niż jednego zdania”?
jbowman
4
Ten dokument jest teraz bez odpowiedzi, ponieważ jest 404.
whuber
2
Droga powrotna

Odpowiedzi:

30

Jakobianie - absolutne determinanty zmiany funkcji zmiennej - wydają się budzić grozę i mogą być skomplikowane. Niemniej są one istotną i nieuniknioną częścią obliczania wielowymiarowej zmiany zmiennej. Wydaje się, że nie ma na to nic innego, jak zapisać macierz pochodnych k+1 na k+1 i wykonać obliczenia.

Jest lepszy sposób. Jest pokazany na końcu w sekcji „Rozwiązanie”. Ponieważ celem tego postu jest wprowadzenie statystyk do co może być nową metodą dla wielu, wiele z nich poświęcono wyjaśnieniu mechanizmów stojących za rozwiązaniem. To jest algebra form różniczkowych . (Formy różnicowe to rzeczy, które integruje się w wielu wymiarach.) Szczegółowy, działający przykład jest dołączony, aby pomóc to lepiej poznać.


tło

Ponad sto lat temu matematycy opracowali teorię algebry różniczkowej do pracy z „pochodnymi wyższego rzędu” występującymi w geometrii wielowymiarowej. Wyznacznik jest szczególnym przypadkiem podstawowych obiektów manipulowanych przez takie algebry, które zwykle są przemiennymi formami wieloliniowymi . Piękno tego leży w tym, jak proste mogą być obliczenia.

Oto wszystko, co musisz wiedzieć.

  1. Różnica to ekspresja w postaci „ dxi ”. Jest to konkatenacja „ d ” z dowolną nazwą zmiennej.

  2. Jedna forma to liniowa kombinacja różnic, takich jak lub nawet x 2 d x 1 - exp ( x 2 ) d x 2 . Oznacza to, że współczynniki są funkcjami zmiennych.dx1+dx2x2dx1exp(x2)dx2

  3. Formularze można „pomnożyć” za pomocą iloczynu klinowego , napisanego . Ten produkt działa przeciw przemiennie (zwany również naprzemiennie ): dla dowolnych dwóch jednopostaci ω i η ,ωη

    ωη=ηω.

    To zwielokrotnienie jest liniowe i asocjacyjne: innymi słowy, działa w znany sposób. Bezpośrednią konsekwencją jest to, że , co oznacza, że ​​kwadrat dowolnej formy jest zawsze równy zero. To sprawia, że ​​mnożenie jest niezwykle proste!ωω=ωω

  4. Do celów manipulowania całkami pojawiającymi się w obliczeniach prawdopodobieństwa wyrażenie takie jak można rozumieć jako | d x 1d x 2d x k + 1 | .dx1dx2dxk+1|dx1dx2dxk+1|

  5. Gdy jest funkcją, wówczas jej różnicę podaje się przez różnicowanie:y=g(x1,,xn)

    dy=dg(x1,,xn)=gx1(x1,,xn)dx1++gx1(x1,,xn)dxn.

The connection with Jacobians is this: the Jacobian of a transformation (y1,,yn)=F(x1,,xn)=(f1(x1,,xn),,fn(x1,,xn)) is, up to sign, simply the coefficient of który pojawia się w obliczeniachdx1dxn

dy1dyn=df1(x1,,xn)dfn(x1,,xn)

po rozwinięciu każdego z jako liniowej kombinacji d x j w regule (5).dfidxj


Przykład

Prostota tej definicji jakobianów jest pociągająca. Nie jesteś jeszcze przekonany, czy warto? Rozważ dobrze znany problem przekształcania całek dwuwymiarowych ze współrzędnych kartezjańskich na współrzędne biegunowe ( r , θ ) , gdzie ( x , y ) = ( r cos ( θ ) , r sin ( θ ) ) . Poniżej znajduje się całkowicie mechaniczne zastosowanie powyższych zasad, gdzie „ ( )(x,y)(r,θ)(x,y)=(rcos(θ),rsin(θ))()" is used to abbreviate expressions that will obviously disappear by virtue of rule (3), which implies drdr=dθdθ=0.

dxdy=|dxdy|=|d(rcos(θ))d(rsin(θ))|=|(cos(θ)drrsin(θ)dθ)(sin(θ)dr+rcos(θ)dθ|=|()drdr+()dθdθrsin(θ)dθsin(θ)dr+cos(θ)drrcos(θ)dθ|=|0+0+rsin2(θ)drdθ+rcos2(θ)drdθ|=|r(sin2(θ)+cos2(θ))drdθ)|=r drdθ.

The point of this is the ease with which such calculations can be performed, without messing about with matrices, determinants, or other such multi-indicial objects. You just multiply things out, remembering that wedges are anti-commutative. It's easier than what is taught in high school algebra.


Preliminaries

Let's see this differential algebra in action. In this problem, the PDF of the joint distribution of (X1,X2,,Xk+1) is the product of the individual PDFs (because the Xi are assumed to be independent). In order to handle the change to the variables Yi we must be explicit about the differential elements that will be integrated. These form the term dx1dx2dxk+1. Including the PDF gives the probability element

fX(x,α)dx1dxk+1(x1α11exp(x1))(xk+1αk+11exp(xk+1))dx1dxk+1=x1α11xk+1αk+11exp((x1++xk+1))dx1dxk+1.

(The normalizing constant has been ignored; it will be recovered at the end.)

Staring at the definitions of the Yi a few seconds ought to reveal the utility of introducing the new variable

Z=X1+X2++Xk+1,

giving the relationships

Xi=YiZ.

This suggests making the change of variables xiyiz in the probability element. The intention is to retain the first k variables y1,,yk along with z and then integrate out z. To do so, we have to re-express all the dxi in terms of the new variables. This is the heart of the problem. It's where the differential algebra takes place. To begin with,

dxi=d(yiz)=yidz+zdyi.

Note that since Y1+Y2++Yk+1=1, then

0=d(1)=d(y1+y2++yk+1)=dy1+dy2++dyk+1.

Consider the one-form

ω=dx1++dxk=z(dy1++dyk)+(y1++yk)dz.

It appears in the differential of the last variable:

dxk+1=zdyk+1+yk+1dz=z(dy1++dyk)+(1y1yk)dz=dzω.

The value of this lies in the observation that

dx1dxkω=0

because, when you expand this product, there is one term containing dx1dx1=0 as a factor, another containing dx2dx2=0, and so on: they all disappear. Consequently,

dx1dxkdxk+1=dx1dxkzdx1dxkω=dx1dxkz.

Whence (because all products dzdz disappear),

dx1dxk+1=(zdy1+y1dz)(zdyk+ykdz)dz=zkdy1dykdz.

The Jacobian is simply |zk|=zk, the coefficient of the differential product on the right hand side.


Solution

The transformation (x1,,xk,xk+1)(y1,,yk,z) is one-to-one: its inverse is given by xi=yiz for 1ik and xk+1=z(1y1yk). Therefore we don't have to fuss any more about the new probability element; it simply is

(zy1)α11(zyk)αk1(z(1y1yk))αk+11exp(z)|zkdy1dykdz|=(zα1++αk+11exp(z)dz)(y1α11ykαk1(1y1yk)αk+11dy1dyk).

That is manifestly a product of a Gamma(α1++αk+1) distribution (for Z) and a Dirichlet(α) distribution (for (Y1,,Yk)). In fact, since the original normalizing constant must have been a product of Γ(αi), we deduce immediately that the new normalizing constant must be divided by Γ(α1++αk+1), enabling the PDF to be written

fY(y,α)=Γ(α1++αk+1)Γ(α1)Γ(αk+1)(y1α11ykαk1(1y1yk)αk+11).
whuber
źródło