Rozkłady gamma a logarytmiczne

29

Mam obserwowany eksperymentalnie rozkład, który wygląda bardzo podobnie do rozkładu gamma lub logarytmicznego. Czytałem, że rozkład logarytmiczny jest maksymalnym rozkładem prawdopodobieństwa entropii dla wariantu losowego dla którego ustalona jest średnia i wariancja . Czy rozkład gamma ma podobne właściwości?Xln(X)

OSE
źródło
2
Dlaczego taka właściwość miałaby mieć jakąkolwiek wartość przy podejmowaniu decyzji, który model byłby odpowiedni?
Glen_b
@Glen_b Nadal jestem początkującym, jeśli chodzi o statystyki, więc moja wiedza jest dość podstawowa. Patrząc na wykresy rozkładów gamma i lognormalnych, jakościowo wyglądają bardzo podobnie. Szukam różnic ilościowych między nimi. Na przykład, jakie są przykłady fizycznych zastosowań, w których występuje rozkład gamma lub logarytmiczny?
OSE
W rzeczywistości prawdopodobnie nigdy tak naprawdę nie występuje; są niezwykle prostymi modelami, które czasami są przydatnymi (choć przybliżonymi) przybliżeniami rzeczywistości. Wyślę odpowiedź, która omawia pewne różnice jakościowe.
Glen_b
1
@glen_b: powodem jest to, że jeśli mierzysz tylko te statystyki, wówczas minimalny rozkład przypuszczalny jest jednoznacznie rozkładem wykładniczym rodziny z tymi wystarczającymi statystykami. Podczas gdy jakikolwiek rozkład może być złym modelem rzeczywistości, jeśli nie można swobodnie wybierać, które pomiary należy podjąć, jest to doskonały sposób na wybór modelu.
Neil G
1
@Glen_b Wydaje mi się, że rozkład logarytmiczny powinien pojawić się w niektórych sytuacjach fizycznych z powodu CLT.
Stéphane Laurent,

Odpowiedzi:

27

Jeśli chodzi o różnice jakościowe, lognormal i gamma są, jak mówisz, dość podobne.

Rzeczywiście, w praktyce często wykorzystuje się je do modelowania tych samych zjawisk (niektórzy używają gamma, a inni logarytmicznie). Oba są, na przykład, modelami o stałym współczynniku zmienności (CV dla lognormal wynosi , dla gamma jest to1/eσ211/α ).

[W jaki sposób może być stały, jeśli zależy od parametru, pytasz? Ma to zastosowanie podczas modelowania wagi (lokalizacja dla skali dziennika); dla logarytmu normalnego działa jako parametr skali, podczas gdy dla gamma skala jest parametrem, który nie jest parametrem kształtu (lub jest odwrotny, jeśli używasz parametryzacji szybkości kształtu). Wywołam parametr skali dla rozkładu gamma β . Gamma GLM modelują średnią ( μ = α β ), utrzymując stałą α ; w takim przypadku μ jest również parametrem skali. Model o zmiennej μ i stałej α lub σμβμ=αβαμμασ będzie miał odpowiednio stałe CV.]

Warto spojrzeć na gęstość ich kłód , co często pokazuje bardzo wyraźną różnicę.

Dziennik logarytmicznej zmiennej losowej jest ... normalny. Jest symetryczny.

Dziennik zmiennej losowej gamma jest przekrzywiony w lewo. W zależności od wartości parametru kształtu może być dość pochylony lub prawie symetryczny.

Oto przykład, gdzie zarówno lognormal, jak i gamma mają średnią 1 i wariancję 1/4. Górny wykres pokazuje gęstości (gamma na zielono, logarytm normalny na niebiesko), a dolny pokazuje gęstość logów:

gamma i lognormal, gęstość i gęstość log

(Przydatne jest również wykreślanie dziennika gęstości kłód. To znaczy, przyjmowanie skali dziennika na osi y powyżej)

CV3+3CV2CV

Glen_b - Przywróć Monikę
źródło
+1. Czy wiesz, czy istnieje zamknięta formuła skosu dziennika gamma? Dla lognormal skośność logu jest wyraźnie równa zero i zastanawiam się, czy istnieje jakiś wyraz dla gamma. Wikipedia podaje wzory na średnią i wariancję log (gamma), ale nie na skośność.
ameba mówi Przywróć Monikę
0xν1eμx(lnx)pdxp=2,3,4p=1Γ,ψζpjako pochodna funkcji gamma, więc przypuszczalnie możliwe jest osiągnięcie wyższego poziomu. Zatem skośność jest z pewnością wykonalna, ale nie jest szczególnie „schludna”. Jeśli chcesz kontynuować, mógłbym dać ci całki.
Glen_b
Jednak nie musimy oceniać skośności, aby rozpoznać jej znak. Badanie kłody pod kątem gęstości kłód powinno wystarczyć, aby ustalić, że ponieważ jedna strona wyraźnie dominuje nad drugą.
Glen_b
Dzięki Glen. Postanowiłem opublikować to jako nowe pytanie: stats.stackexchange.com/questions/312803 . Spędziłem trochę czasu na szukaniu gotowej odpowiedzi, ale nie mogłem jej znaleźć, więc może być cenne dla przyszłości, aby zapisać ją w miejscu, w którym łatwo ją znaleźć. Może to nieco lepiej pasuje do Math.SE, ale szczerze mówiąc, wolałbym mieć go tutaj.
ameba mówi Przywróć Monikę
11

E(X)E(logX) ustalono . Podobnie jak w przypadku wszystkich wykładniczych rozkładów rodziny, jest to unikalny maksymalny rozkład entropii dla ustalonej oczekiwanej wystarczającej statystyki.

Aby odpowiedzieć na pytanie dotyczące procesów fizycznych generujących te rozkłady: Rozkład logarytmiczny powstaje, gdy logarytm X jest zwykle rozkładany, na przykład, jeśli X jest iloczynem bardzo wielu małych czynników. Jeśli X jest rozkładem gamma, jest to suma wielu zmiennych rozkładów wykładniczych. Na przykład czas oczekiwania na wiele zdarzeń procesu Poissona.

Neil G.
źródło
5
Nie ma potrzeby stosowania „wielu” zmiennych wykładniczych w celu uzyskania wartości gamma.
Stéphane Laurent,