Skośność logarytmu zmiennej losowej gamma

16

Rozważ losową zmienną gamma . Istnieją zgrabne wzory na średnią, wariancję i skośność:XΓ(α,θ)

E[X]=αθVar[X]=αθ2=1/αE[X]2Skewness[X]=2/α

Rozważmy teraz zmienną losową przekształconą logarytmicznie . Wikipedia podaje wzory na średnią i wariancję:Y=log(X)

E[Y]=ψ(α)+log(θ)Var[Y]=ψ1(α)

poprzez funkcje digamma i trigamma, które są zdefiniowane jako pierwsza i druga pochodna logarytmu funkcji gamma.

Jaka jest formuła skosu?

Czy pojawi się funkcja tetragammy?

(Zastanawiałem się nad tym, to wybór między rozkładem logarytmicznym a rozkładem gamma, zobacz Rozkład gamma vs. rozkład logarytmiczny . Między innymi różnią się właściwościami skośności. W szczególności skośność logarytmu logarytmicznego jest trywialnie równa zeru. skośność log gamma jest ujemna. Ale jak ujemna? ..)

ameba mówi Przywróć Monikę
źródło
1
Czy to pomaga? Czy to ?
Stephan Kolassa
Nie jestem do końca pewien, czym jest rozkład log-gamma. Jeśli jest to związane z gamma, ponieważ lognormal odnosi się do normalności, to pytam o coś innego (ponieważ „lognormal”, myląco, to rozkład exp (normalny) nie log (normalny)).
ameba mówi Przywróć Monikę
1
@Glen_b: Szczerze mówiąc, powiedziałbym, że nazwanie wykładniczej wartości normalnej „lognormalną” jest znacznie bardziej niespójne i zagmatwane. Chociaż niestety bardziej ustalone.
Stephan Kolassa
2
@Stephan patrz także log-logistic, log-Cauchy, log-Laplace itp. Jest to konwencja bardziej wyraźnie ustalona niż odwrotnie
Glen_b
1
Tak; Z tego powodu starałem się nie mówić „log-gamma” w odniesieniu do tej dystrybucji. (
Używałem

Odpowiedzi:

12

W tym przypadku pomocna jest funkcja generująca moment M.(t) dla Y=lnX , ponieważ ma ona prostą formę algebraiczną. Według definicji mgf mamy

M(t)=E[etlnX]=E[Xt]=1Γ(α)θα0xα+t1ex/θdx=θtΓ(α)0yα+t1eydy=θtΓ(α+t)Γ(α).

Sprawdźmy oczekiwanie i wariancję, którą podałeś. Biorąc pochodne, mamy iM(t)=Γ(α+t)

M(t)=Γ(α+t)Γ(α)θt+Γ(α+t)Γ(α)θtln(θ)
StądE[Y]=ψ(0)(α)+ln(θ),
M.(t)=Γ(α+t)Γ(α)θt+2)Γ(α+t)Γ(α)θtln(θ)+Γ(α+t)Γ(α)θtln2)(θ).
Wynika z tego, żeVar(Y)=E[Y2]-E[Y]2=Γ(α)
E[Y]=ψ(0)(α)+ln(θ),E[Y2]=Γ(α)Γ(α)+2ψ(0)(α)ln(θ)+ln2(θ).
Var(Y)=E[Y2]E[Y]2=Γ(α)Γ(α)(Γ(α)Γ(α))2=ψ(1)(α).

Aby znaleźć skośność, zwróć uwagę, że funkcja generowania skumulowanego (dzięki @probabilityislogic dla końcówki) to Pierwszym kumulantem jest zatem po prostu K ' ( 0 ) = ψ ( 0 ) ( α ) + ln ( θ ) . Odwołaj to

K(t)=lnM(t)=tlnθ+lnΓ(α+t)lnΓ(α).
K(0)=ψ(0)(α)+ln(θ) , więc kolejne kumulanty to K ( n ) ( 0 ) = ψ ( n - 1 ) ( α ) , n 2 . Skośność wynosi zatem E [ ( Y - E [ Y ] ) 3ψ(n)(x)=dn+1lnΓ(x)/dxn+1K(n)(0)=ψ(n1)(α)n2
E[(YE[Y])3]Var(Y)3/2=ψ(2)(α)[ψ(1)(α)]3/2.

Na marginesie, ten szczególny rozkład wydawał się być dokładnie zbadany przez AC Olshen w jego Transformacjach rozkładu Pearsona typu III , Continuous Univariate Distribution Johnsona i wsp. Również ma mały kawałek na ten temat. Sprawdź to.

Francis
źródło
3
Należy rozróżnić zamiast M ( t ), ponieważ jest to suma funkcja generująca - bardziej bezpośrednio związana z momentami centralnymi - s k e w = K ( 3 )K(t)=log[M(t)]=tlog[θ]+log[Γ(α+t)]log[Γ(α)]M(t) gdzie ψ ( n ) ( z ) jest funkcją poligammyskew=K(3)(0)=ψ(2)(α)ψ(n)(z)
prawdopodobieństwo
1
@probabilityislogic: bardzo dobre połączenie, zmieniłem moją odpowiedź
Francis
@probabilityislogic To świetny dodatek, wielkie dzięki. Chcę tylko zauważyć, aby niektórzy czytelnicy nie byli zdezorientowani, że skośność nie wynika bezpośrednio z trzeciego kumulanta: jest to trzeci znormalizowany moment, a nie trzeci centralny moment. Francis ma rację w swojej odpowiedzi, ale ostatnia formuła w twoim komentarzu nie jest całkiem poprawna.
ameba mówi Przywróć Monikę
13

I. Obliczenia bezpośrednie

0xν1eμx(lnx)pdx
p=2,3,4p=1Γ,ψζpjako pochodna funkcji gamma, więc przypuszczalnie możliwe jest osiągnięcie wyższego poziomu. Zatem skośność jest z pewnością wykonalna, ale nie jest szczególnie „schludna”.

Szczegóły dotyczące wyprowadzania wzorów w 4.358 znajdują się w [2]. Zacytuję podane tam formuły, ponieważ są one nieco bardziej zwięźle podane i umieszczę 4.352.1 w tej samej formie.

δ=ψ(a)lnμ. Then:

0xa1eμxlnxdx=Γ(a)μa{δ}0xa1eμxln2xdx=Γ(a)μa{δ2+ζ(2,a)}0xa1eμxln3xdx=Γ(a)μa{δ3+3ζ(2,a)δ2ζ(3,a)}0xa1eμxln4xdx=Γ(a)μa{δ4+6ζ(2,a)δ28ζ(3,a)δ+3ζ2(2,a)+6ζ(4,a))}

where ζ(z,q)=n=01(n+q)z is the Hurwitz zeta function (the Riemann zeta function is the special case q=1).

Now on to the moments of the log of a gamma random variable.

Noting firstly that on the log scale the scale or rate parameter of the gamma density is merely a shift-parameter, so it has no impact on the central moments; we may take whichever one we're using to be 1.

If XGamma(α,1) then

E(logpX)=1Γ(α)0logpxxα1exdx.

We can set μ=1 in the above integral formulas, which gives us raw moments; we have E(Y), E(Y2), E(Y3), E(Y4).

Since we have eliminated μ from the above, without fear of confusion we're now free to re-use μk to represent the k-th central moment in the usual fashion. We may then obtain the central moments from the raw moments via the usual formulas.

Then we can obtain the skewness and kurtosis as μ3μ23/2 and μ4μ22.


A note on terminology

It looks like Wolfram's reference pages write the moments of this distribution (they call it ExpGamma distribution) in terms of the polygamma function.

By contrast, Chan (see below) calls this the log-gamma distribution.


II. Chan's formulas via MGF

Chan (1993) [3] gives the mgf as the very neat Γ(α+t)/Γ(α).

(A very nice derivation for this is given in Francis' answer, using the simple fact that the mgf of log(X) is just E(Xt).)

Consequently the moments have fairly simple forms. Chan gives:

E(Y)=ψ(α)

and the central moments as

E(YμY)2=ψ(α)E(YμY)3=ψ(α)E(YμY)4=ψ(α)

and so the skewness is ψ(α)/(ψ(α)3/2) and kurtosis is ψ(α)/(ψ(α)2). Presumably the earlier formulas I have above should simplify to these.

Conveniently, R offers digamma (ψ) and trigamma (ψ) functions as well as the more general polygamma function where you select the order of the derivative. (A number of other programs offer similarly convenient functions.)

Consequently we can compute the skewness and kurtosis quite directly in R:

skew.eg <- function(a) psigamma(a,2)/psigamma(a,1)^(3/2)
kurt.eg <- function(a) psigamma(a,3)/psigamma(a,1)^2

Trying a few values of a (α in the above), we reproduce the first few rows of the table at the end of Sec 2.2 in Chan [3], except that the kurtosis values in that table are supposed to be excess kurtosis, but I just calculated kurtosis by the formulas given above by Chan; these should differ by 3.

(E.g. for the log of an exponential, the table says the excess kurtosis is 2.4, but the formula for β2 is ψ(1)/ψ(1)2 ... and that is 2.4.)

Simulation confirms that as we increase sample size, the kurtosis of a log of an exponential is converging to around 5.4 not 2.4. It appears that the thesis possibly has an error.

Consequently, Chan's formulas for central moments appear to actually be the formulas for the cumulants (see the derivation in Francis' answer). This would then mean that the skewness formula was correct as is; because the second and third cumulants are equal to the second and third central moments.

Nevertheless these are particularly convenient formulas as long as we keep in mind that kurt.eg is giving excess kurtosis.

References

[1] Gradshteyn, I.S. & Ryzhik I.M. (2007), Table of Integrals, Series, and Products, 7th ed.
Academic Press, Inc.

[2] Victor H. Moll (2007)
The integrals in Gradshteyn and Ryzhik, Part 4: The gamma function
SCIENTIA Series A: Mathematical Sciences, Vol. 15, 37–46
Universidad Técnica Federico Santa María, Valparaíso, Chile
http://129.81.170.14/~vhm/FORM-PROOFS_html/final4.pdf

[3] Chan, P.S. (1993),
A statistical study of log-gamma distribution,
McMaster University (Ph.D. thesis)
https://macsphere.mcmaster.ca/bitstream/11375/6816/1/fulltext.pdf

Glen_b -Reinstate Monica
źródło
1
Chłodny. Wielkie dzięki! Zgodnie z wpisem do encyklopedii, do którego Stephan odwoływał się powyżej, ostateczną odpowiedzią na skośność jestψ(α)/ψ(α)3)/2)(co prawie kwalifikuje się jako „schludne”!). Wygląda więc na to, że wszystkie przerażające zety będą musiały się skasować.
ameba mówi Przywróć Monikę
1
Przykro mi, ale właśnie teraz zobaczyłem twój komentarz (edytowałem przez około godzinę); to prawda, ale jeśli Encyklopedia podaje kurtozę tak, jak Chan podaje ją w swojej tezie, wydaje się, że jest błędna (jak podano powyżej), ale łatwo ją poprawić. Zgrabne formuły wydają się raczej do kumulantów niż do standardowych momentów centralnych.
Glen_b
Yes, the Encyclopedia does give the same formula for kurtosis.
ameba mówi Przywróć Monikę
Hmm, I mean to refer to the things normally denoted γ1 and γ2. I will fix.
Glen_b
2
Powinienem chyba dodać, że funkcję zeta Hurwitz można wyrazić jako funkcję poligammy i vice versa :
ψ(n)(z)=(-1)n+1Γ(n+1)ζ(n+1,z)
Tak więc odpowiedź na pytanie @ amoeba „czy pojawi się funkcja tetragammy?” jest tak.
JM nie jest statystykiem