Jak wyjaśniłbyś funkcję generowania momentu (MGF) w kategoriach laika?

Co to jest funkcja generowania momentu (MGF)?

Czy potrafisz to wytłumaczyć laikiem wraz z prostym i łatwym przykładem?

Ogranicz w miarę możliwości formalne notacje matematyczne.

moments intuition mgf użytkownik366312
źródło

Chcesz prosty, łatwy przykład ... ale bez notacji matematycznej? Nie jestem pewien, czy coś takiego byłoby bardzo łatwe do zrobienia - przynajmniej nie bez narażania się na mylące wrażenie tego, z czym masz do czynienia. Przypuszczam, że można podać mgf zdegenerowanej zmiennej losowej, która zawsze wynosi

0

$0$ nie wymagając wiele na drodze zapisu matematycznego, ale będzie to niezrozumiałe, jeśli naprawdę chcesz zrozumieć mgfs.

Glen_b

Nie jestem pewien, czy istnieje intuicyjny sposób jego zrozumienia, możesz po prostu pomyśleć o tym jako o „kodowaniu” dystrybucji (przynajmniej, jeśli istnieje, ten pomysł działa trochę lepiej z charakterystycznymi funkcjami).

dsaxton,

Funkcja generowania momentu - jeśli istnieje - jest sposobem na zakodowanie wszystkich nieujemnych liczb całkowitych momentów zmiennej losowej w funkcji, z których można je ponownie wyodrębnić; mgfs może być używany do wykonywania określonych obliczeń, które czasem nie są tak łatwe do wykonania na inne sposoby. Nie oczekuję, że to bardzo pomoże.

Glen_b

Jestem pewien, że widziałeś, jak Joe Blitztein odpowiedział na to samo pytanie na Quora

Antoni Parellada,

Odpowiedzi:

Załóżmy, że intuicja pozbawiona równań nie jest możliwa, i nadal nalegamy na sprowadzenie matematyki do najistotniejszych rzeczy, aby zorientować się, co się dzieje: staramy się uzyskać momenty statystyczne , które po obowiązkowym nawiązaniu do fizyki definiujemy jako wartość oczekiwaną mocy zmiennej losowej. Dla ciągłej zmiennej losowej nieprzetworzony $k$ -ty moment to LOTUS :

\begin{aligned} (1) & mi [X^{k}] & = \int_{- \infty}^{\infty} X^{k} pdf re x \end{aligned}

$\begin{align}\large \color{red}{\mathbb{E}\left[{X^k}\right]} &= \displaystyle\int_{-\infty}^{\infty}\color{blue}{X^k}\,\,\color{green}{\text{pdf}}\,\,\,dx\tag{1}\end{align}$

Funkcja generowania momentu ,

{M.}_{X} (t) : = mi [{mi}^{t X}],

$M_X(t):=\mathbb E\big[e^{tX}\big],$ jest sposobem na obejście tej całki (równanie 1) poprzez wykonanie:

\begin{aligned} (2) & mi [{mi}^{t X}] & = \int_{- \infty}^{\infty} {mi}^{t X} pdf re x \end{aligned}

$\begin{align} \large \color{blue}{\mathbb{E}\left[e^{\,tX}\right]}&=\displaystyle \int_{-\infty}^{\infty}\color{blue}{e^{tX}}\,\color{green}{\text{pdf}}\, dx\tag{2}\end{align}$

Dlaczego? Ponieważ łatwiej i jest tam fantastyczna własność MGF, które mogą być postrzegane przez rozszerzenie serii Maclaurin o $\color{blue}{e^{\,tX}}$

{mi}^{t X} = 1 + \frac{X}{1!} t + \frac{X^{2)}}{2)!} t^{2)} + \frac{X^{3)}}{3)!} t^{3)} + \dots

$e^{tX}=1+\frac{ X }{1!}\, t +\frac{ X^{2} }{2!}t^{2} +\frac{ X^{3} }{3!} t^{3} +\cdots$

Biorąc pod uwagę oczekiwania obu stron tej serii mocy:

\begin{aligned} {M.}_{X} (t) & = mi [{mi}^{t X}] \\ (3) & = 1 + \frac{mi [X]}{1!} t + \frac{mi [X^{2)}]}{2)!} t^{2)} + \frac{mi [X^{3)}]}{3)!} t^{3)} + \dots \end{aligned}

$\begin{align} M_X(t) &= \color{blue}{\mathbb{E}\left[e^{\,tX}\right]} \\[1.5ex] &=1 + \frac{\color{red}{\mathbb{E} \left[X\right]}}{1!} \, t \, + \frac{\color{red}{\mathbb{E} \left[X^2\right]}}{2!} \, t^2 \, + \frac{\color{red}{\mathbb{E} \left[X^3\right]}}{3!} \, t^3 \, + \cdots\tag{3} \end{align}$

momenty wydają się „osadzone” na tej wielomianowej „sznurku”, gotowe do unicestwienia przez różnicowanie $k$ razy i ocenę od zera, gdy przejdziemy przez łatwiejszą integrację (w równaniu (2)) tylko raz na wszystkie momenty! Fakt, że jest to łatwiejsza integracja jest najbardziej widoczny, gdy pdf jest wykładniczy.

Aby odzyskać $k$ -ty moment:

{M.}_{X}^{(k)} (0) = \frac{{re}^{k}}{re t^{k}} {M.}_{X} (t) |_{t = 0}

$M_X^{(k)}(0)=\frac{d^k}{dt^k}M_X(t)\Bigr|_{t=0}$

Fakt, że w końcu istnieje potrzeba różnicowania, sprawia, że nie jest to darmowy lunch - w końcu jest to dwustronna transformata Laplace'a pdf ze zmienionym znakiem w wykładniku:

L. {pdf (x)} (s) = \int_{- \infty}^{\infty} {mi}^{- s x} pdf (x) re x

$\mathcal L \{\text{pdf}(x)\}(s) =\int_{-\infty}^{\infty}e^{-sx}\text{pdf}(x) dx$

takie, że

\begin{matrix} (4) & M_{X} (t) = L {pdf (x)} (- s) . \end{matrix}

$M_X(t)=\mathcal L\{\text{pdf}(x)\}(-s)\tag 4.$

To w efekcie daje nam fizyczną ścieżkę do intuicji. Transformacja Laplace'a działa na $\color{green}{\text{pdf}}$ i rozkłada go na chwile. Podobieństwo do transformacji Fouriera jest nieunikniona : a FT odwzorowuje funkcję do nowej funkcji na prostej rzeczywistej, a Laplace odwzorowuje funkcję do nowej funkcji na płaszczyźnie zespolonej. Transformacja Fouriera wyraża funkcję lub sygnał jako ciąg częstotliwości, podczas gdy transformata Laplace'a rozkłada funkcję na swoje momenty . W rzeczywistości innym sposobem uzyskiwania momentów jest transformacja Fouriera ( funkcja charakterystyczna ). Wykładniczy określenie w transformaty Laplace'a wynosi na ogół od postaci $e^{-st}$ o $s=\sigma + i\,\omega$ , odpowiadającerzeczywistym wykładniczym i wyimaginowanym sinusoidom, i dając wykresy takie jakto:

[ Z przewodnika naukowca i inżyniera po przetwarzaniu sygnałów, Steven W. Smith ]

Dlatego funkcja $M_X(t)$ rozkłada jakoś $\text{pdf}$ na jego „częstotliwości składowe”, gdy $\sigma=0.$ Z równania. (4):

\begin{aligned} M_{X} (t) & = E [e^{- s X}] \\ = \int_{- \infty}^{\infty} e^{- s x} pdf (x) d x \\ = \int_{- \infty}^{\infty} e^{- (σ + i ω) x} pdf (x) d x \\ = \int_{- \infty}^{\infty} e^{- σ x} e^{- i ω x} pdf (x) d x \end{aligned}

$\begin{align}\require{cancel} M_X(t)&=\mathbb E\big[e^{-sX}\big]\\[2ex] &=\displaystyle \int_{-\infty}^{\infty}{e^{-sx}}\,\text{pdf}(x)\, dx\\[2ex] &=\displaystyle \int_{-\infty}^{\infty}{e^{-(\sigma+i\omega)x}}\,\text{pdf}(x)\, dx\\[2ex] &=\displaystyle \int_{-\infty}^{\infty}\cancel{e^{-\sigma x}}\,\color{red}{e^{-i\omega x}\,\text{pdf}(x)\, dx} \end{align}$

co pozostawia nam niewłaściwą całkę części wyrażenia na czerwono, odpowiadającą transformacie Fouriera w pdf.

Ogólnie, intuicja biegunów transformaty Laplace'a polega na tym, że dostarczają one informacji o wykładniczej (rozpadzie) i częstotliwościowej funkcji (w tym przypadku pdf).

$X^k$ $e^{tx}$ $(1)$ $(2)$ $k$ $(2)$ $k$ $(3)$ $0$

Antoni Parellada
źródło

E [e^{t X}]

$E[e^{tX}]$

E [X^{k}]

$E[X^k]$

Chciałbym, aby laicy, którzy rozumieją tę odpowiedź, byli moimi uczniami :)

Aksakal

M. (t) = {mi}^{t μ + 1 / 2) σ^{2)} t^{2)}}

$M(t)=e^{t\mu+1/2\sigma^2t^2}$

\frac{re}{re t} M. (t) |_{t = 0} = μ + σ^{2)} t |_{t = 0} = μ

$\frac d {dt}M(t)|_{t=0}=\mu+\sigma^2t|_{t=0}=\mu$

Co więcej, ponieważ ten MGF koduje wszystko o dystrybucji, jeśli wiesz, jak manipulować funkcją, możesz zastosować operacje na wszystkich cechach dystrybucji jednocześnie! Dlaczego nie zawsze używamy MGF? Po pierwsze, nie w każdej sytuacji MGF jest najłatwiejszym narzędziem. Po drugie, MGF nie zawsze istnieje.

Powyżej laika

f (x) = \frac{1}{\sqrt{2 π}} e^{- x^{2} / 2}

$f(x)=\frac 1 {\sqrt{2\pi}}e^{-x^2/2}$

Możesz obliczyć jego moment, taki jak średnia i odchylenie standardowe, i użyć go na transformowanych zmiennych i funkcjach na losowych normalnych itp.

Możesz pomyśleć o MGF normalnej dystrybucji jako alternatywie dla PDF. Zawiera tę samą ilość informacji. Już pokazałem, jak uzyskać średnią.

σ^{2} = \int_{- \infty}^{\infty} x^{2} \frac{1}{\sqrt{2 π}} e^{- x^{2} / 2} d x = ?

$\sigma^2=\int_{-\infty}^\infty x^2\frac 1 {\sqrt{2\pi}}e^{-x^2/2} dx=?$

M (t) = e^{t^{2} / 2}

$M(t)=e^{t^2/2}$

σ^{2} = \frac{d^{2}}{d t^{2}} M (t) |_{t = 0} = \frac{d}{d t} t |_{t = 0} = 1

$\sigma^2=\frac {d^2} {dt^2}M(t)|_{t=0}=\frac d {dt} t |_{t=0}=1$

Aksakal
źródło

Czy możesz rozwinąć „wszystko”, które koduje na temat dystrybucji?

ColorStatistics

Aby docenić argument dokonany przez @ColorStatistics, zobacz stats.stackexchange.com/questions/25010 .

whuber

@whuber: Dziękuję, whuber. Przestudiuję ten odnośnik. To jest temat, który chcę lepiej zrozumieć.

ColorStatistics

Jak możemy udowodnić, że MGF i PDF zawierają taką samą ilość informacji?

Aerin