Niedawno uznałem za konieczne wyprowadzenie pdf dla kwadratu normalnej zmiennej losowej ze średnią 0. Z jakiegokolwiek powodu postanowiłem nie normalizować wcześniej wariancji. Jeśli zrobiłem to poprawnie, ten plik pdf wygląda następująco:
Zauważyłem, że w rzeczywistości była to tylko parametryzacja rozkładu gamma:
A następnie, z faktu, że suma dwóch gamma (z tym samym parametrem skali) jest równa innej gamma, wynika z tego, że gamma jest równoważna sumie kwadratowych normalnych zmiennych losowych.
To było dla mnie trochę zaskakujące. Mimo że wiedziałem, że - rozkład sumy kwadratowych standardowych RV normalnych - był szczególnym przypadkiem gamma, nie zdawałem sobie sprawy, że gamma była zasadniczo tylko uogólnieniem uwzględniającym sumę normalnego zmienne losowe dowolnej wariancji. Prowadzi to również do innych charakterystyk, których wcześniej nie spotkałem, takich jak rozkład wykładniczy odpowiadający sumie dwóch kwadratowych rozkładów normalnych.
To dla mnie trochę tajemnicze. Czy rozkład normalny ma podstawowe znaczenie dla wyprowadzenia rozkładu gamma w sposób opisany powyżej? Większość zasobów, które sprawdziłem, nie wspominają, że te dwie dystrybucje są wewnętrznie powiązane w ten sposób, a nawet w tym przypadku opisują, w jaki sposób otrzymywana jest gamma. To sprawia, że myślę, że w grę wchodzi jakaś prawda niższego poziomu, którą po prostu podkreśliłem w zawiły sposób?
Odpowiedzi:
Jak zauważył komentarz prof. Sarwate, relacje między kwadratową normą a chi-kwadratem są bardzo szeroko rozpowszechnionym faktem - podobnie jak fakt, że chi-kwadrat jest tylko szczególnym przypadkiem rozkładu gamma:
ostatnia równość wynikająca z właściwości skalowania gamma.
Jeśli chodzi o związek z wykładniczym, dokładnym jest suma dwóch kwadratowych normalnych zerowych średnich, z których każdy jest skalowany przez wariancję drugiego , co prowadzi do rozkładu wykładniczego:
Jednak podejrzenie, że istnieje „coś specjalnego” lub „głębszego” w sumie dwóch kwadratów zero oznacza normalne, które „czynią z nich dobry model czasu oczekiwania” jest bezpodstawne: po pierwsze, co jest specjalnego w rozkładzie wykładniczym, który sprawia, że to dobry model na „czas oczekiwania”? Oczywiście bez pamięci, ale czy jest tu coś „głębszego”, czy tylko prosta funkcjonalna postać funkcji rozkładu wykładniczego i właściwości ? Unikalne właściwości są rozrzucone po całej matematyce i przez większość czasu nie odzwierciedlają „głębszej intuicji” lub „struktury” - po prostu istnieją (na szczęście).mi
Po drugie, kwadrat zmiennej ma bardzo niewielki związek z jej poziomem. Wystarczy rozważyć w, powiedzmy, :[ - 2 ,fa( x ) = x [ - 2 ,2 ]
... lub wykreślić standardową gęstość normalną w stosunku do gęstości chi-kwadrat: odzwierciedlają i reprezentują zupełnie inne zachowania stochastyczne, mimo że są tak ściśle ze sobą powiązane, ponieważ druga to gęstość zmiennej, która jest kwadratem pierwszej. Normalna może być bardzo ważnym filarem systemu matematycznego, który opracowaliśmy w celu modelowania zachowania stochastycznego - ale kiedy go wyprostujesz, stanie się czymś zupełnie innym.
źródło
Zajmijmy się postawionym pytaniem: To wszystko jest dla mnie nieco tajemnicze. Czy rozkład normalny ma podstawowe znaczenie dla wyprowadzenia rozkładu gamma ...? Nie jest tajemnicą, po prostu rozkład normalny i rozkład gamma są członkami, między innymi wykładniczej rodziny rozkładów, której rodzina jest definiowana przez zdolność do konwersji między formami równościowymi przez podstawienie parametrów i / lub zmiennych. W konsekwencji, istnieje wiele konwersji przez podstawienie między rozkładami, A niektóre z nich są podsumowane na poniższym rysunku.
LEEMIS, Lawrence M .; Jacquelyn T. MCQUESTON (luty 2008). „Univariate Distribution Relations” (PDF). American Statistician. 62 (1): 45–53. doi: 10.1198 / 000313008x270448 przytocz
Oto dwa bardziej szczegółowo relacje rozkładu normalnego i rozkładu gamma (wśród nieznanej liczby innych, np. Poprzez chi-kwadrat i beta).
Po pierwsze, następuje bardziej bezpośredni związek między rozkładem gamma (GD) a rozkładem normalnym (ND) ze średnią zero. Mówiąc najprościej, GD ma normalny kształt, ponieważ jego parametr kształtu może wzrosnąć. Udowodnienie, że tak jest, jest trudniejsze. W przypadku GD
Ponieważ parametr kształtu GD , kształt GD staje się bardziej symetryczny i normalny, jednak wraz ze wzrostem średniej wraz ze wzrostem musimy przesunąć GD w lewo o aby utrzymać go w bezruchu, a na koniec, jeśli chcemy zachować to samo odchylenie standardowe dla naszego przesuniętego GD, musimy zmniejszyć parametr skali ( ) proporcjonalnie do .a → ∞ za ( a - 1 ) 1za--√k b 1za--√
Aby przekształcić GD w przypadek ograniczający ND, ustawiliśmy standardowe odchylenie na stałą ( ), pozwalając i przesunąć GD w lewo, aby mieć tryb zerowy przez podstawienieNastępniek b = 1za--√k z= ( a - 1 ) 1za--√k + x .
Zauważ, że w limicie jako najbardziej ujemna wartość dla której ten GD jest niezerowy . Oznacza to, że częściowo nieskończone wsparcie GD staje się nieskończone . Przyjmując limit jako sparametryzowanego GD, znajdujemya → ∞ x → - ∞ a → ∞
Graficznie dla i GD jest w kolorze niebieskim, a ograniczenie jest w pomarańczowy poniżejk = 2 a = 1 , 2 , 4 , 8 , 16 , 32 , 64 ND ( x ; 0 , 2 2))
Po drugie. Zwróćmy uwagę, że ze względu na podobieństwo formy między tymi rozkładami, można właściwie rozwinąć relacje między rozkładami gamma i rozkładów normalnych, wyciągając je z cienkiego powietrza. Innymi słowy, opracowujemy uogólnione rozkładanie gamma rozkładu normalnego rozkładu gamma.
Zauważ najpierw, że to częściowo nieskończone wsparcie rozkładu gamma utrudnia bardziej bezpośredni związek z rozkładem normalnym. Jednak przeszkodę tę można usunąć, biorąc pod uwagę rozkład w połowie normalny, który ma również częściowo nieskończone wsparcie. Zatem można uogólnić rozkład normalny (ND), najpierw składając go do połowy normalnej (HND), odnosząc się do uogólnionego rozkładu gamma (GD), a następnie dla naszego tour de force „rozkładamy” oba (HND i GD), aby w ten sposób uogólnić ND (GND).
Uogólniony rozkład gamma
Może być ponownie sparametryzowany, aby był rozkładem w połowie normalnym ,
Zauważ, żeZatemθ = π√σ2)√.
co implikuje to
jest uogólnieniem rozkładu normalnego, gdzie to lokalizacja, to skala, a to kształt, a gdzie daje rozkład normalny. Obejmuje rozkład Laplace'a, gdy . Gdy , gęstość zbiega się punktowo z jednolitą gęstością na . Poniżej przedstawiono uogólniony rozkład normalny wykreślony dla w kolorze niebieskim z normalnym przypadkiem w kolorze pomarańczowym.μ α > 0 β> 0 β= 2 β= 1 β→ ∞ ( μ - α , μ + α ) α = π√2), β= 1 / 2 , 1 , 4 α = π√2),β= 2
Powyższe można postrzegać jako uogólniony rozkład normalny Wersja 1, aw różnych parametryzacjach jest znany jako wykładniczy rozkład mocy, a uogólniony rozkład błędów, który z kolei jest jednym z kilku innych uogólnionych rozkładów normalnych .
źródło
Wyprowadzenie rozkładu chi-kwadrat z rozkładu normalnego jest bardzo analogiczne do wyprowadzenia rozkładu gamma z rozkładu wykładniczego.
Powinniśmy być w stanie uogólnić to:
Analogia jest następująca:
Rozkłady normalne i chi-kwadrat odnoszą się do sumy kwadratów
Łączny rozkład gęstości wielu niezależnych standardowych rozkładów normalnych zależy od∑ x2)ja
fa( x1,x2), . . . ,xn) =exp( - 0,5 ∑ni = 1xja2))( 2 π)n / 2
JeśliXja∼ N.( 0 , 1 )
następnie∑ni = 1Xja2)∼ χ2)( ν)
Rozkłady wykładnicze i gamma odnoszą się do sumy regularnej
Łączny rozkład gęstości wielu niezależnych wykładniczych zmiennych rozkładowych zależy od∑ xja
JeśliXja∼ Ex p ( λ )
następnie∑ni = 1Xja∼ Gamma ( n , λ )
Derywacji można dokonać przez zmianę zmiennych integrujących się nie na wszystkich ale tylko na podstawie sumy (to właśnie zrobił Pearson w 1900 r.). W obu przypadkach przebiega to bardzo podobnie.x1, x2), . . . xn
Dla dystrybucji :χ2)
Gdzie to n-wymiarowa objętość piłki n o kwadratowym promieniu .V.( s ) = πn / 2Γ ( n / 2 + 1 )sn / 2 s
W przypadku rozkładu gamma:
Gdzie To n-wymiarowa objętość n-polytopu z .V.( s ) = snn ! ∑ xja< s
Rozkład gamma można postrzegać jako czas oczekiwania dla zdarzenia w procesie Poissona, który jest rozkładany jako suma zmiennych wykładniczych.Y n n
Jak zauważył już Alecos Papadopoulos, nie ma głębszego połączenia, które czyni sumy kwadratowych zmiennych normalnych „dobrym modelem czasu oczekiwania”. Rozkład gamma jest rozkładem sumy uogólnionych normalnych zmiennych rozproszonych. W ten sposób spotykają się dwoje.
Ale rodzaj sumy i rodzaj zmiennych mogą być różne. Podczas gdy rozkład gamma, uzyskany z rozkładu wykładniczego (p = 1), otrzymuje interpretację rozkładu wykładniczego (czas oczekiwania), nie można cofnąć się i wrócić do sumy kwadratowych zmiennych Gaussa i użyć tej samej interpretacji.
Rozkład gęstości dla czasu oczekiwania, który spada wykładniczo, i rozkład gęstości dla błędu Gaussa spada wykładniczo (z kwadratem). To kolejny sposób na połączenie tych dwóch.
źródło