Jak jestem pewien, wszyscy już tu wiedzą, plik PDF dystrybucji Beta jest podany przez
Wszędzie szukałem wyjaśnień na temat pochodzenia tej formuły, ale nie mogę jej znaleźć. Każdy artykuł, który znalazłem w dystrybucji Beta, wydaje się podawać tę formułę, ilustrować kilka jej kształtów, a następnie przejść do dyskusji na temat swoich chwil i stamtąd.
Nie lubię używać wzorów matematycznych, których nie potrafię wyprowadzić i wyjaśnić. W przypadku innych dystrybucji (np. Gamma lub dwumianowa) istnieje wyraźne wyprowadzenie, którego mogę się nauczyć i używać. Ale nie mogę znaleźć czegoś takiego w dystrybucji Beta.
Moje pytanie brzmi: jakie są początki tej formuły? Jak można to wywnioskować z pierwszych zasad w jakimkolwiek kontekście, w jakim został pierwotnie opracowany?
[Aby wyjaśnić, nie pytam o to, jak korzystać z rozkładu Beta w statystykach bayesowskich, ani co to znaczy intuicyjnie w praktyce (przeczytałem przykład baseballu). Chcę tylko wiedzieć, jak uzyskać plik PDF. Było poprzednie pytanie, które zadawało coś podobnego, ale zostało oznaczone (chyba niepoprawnie) jako duplikat innego pytania, które nie rozwiązało problemu, więc jak dotąd nie znalazłem tutaj żadnej pomocy.]
EDYCJA 2017-05-06: Dziękuję wszystkim za pytania. Myślę, że dobre wyjaśnienie tego, czego chcę, pochodzi z jednej z odpowiedzi, które otrzymałem, gdy zapytałem o to niektórych z moich instruktorów kursu:
„Wydaje mi się, że ludzie mogliby uzyskać normalną gęstość jako limit sumy n rzeczy podzielonych przez sqrt (n), a gęstość poissona można wywnioskować z idei zdarzeń zachodzących w stałym tempie. Podobnie, aby uzyskać gęstość beta, trzeba mieć pewien pomysł na to, co sprawia, że coś jest wersją beta niezależną od gęstości i logicznie przed nią ”.
Więc pomysł „ab initio” w komentarzach jest prawdopodobnie najbliższy temu, czego szukam. Nie jestem matematykiem, ale czuję się najlepiej, używając matematyki, którą potrafię wyprowadzić. Jeśli pochodzenie jest dla mnie zbyt zaawansowane, niech tak będzie, ale jeśli nie, chciałbym je zrozumieć.
źródło
Odpowiedzi:
Jako były fizyk widzę, jak można to wyprowadzić. Tak postępują fizycy:
gdy napotkają całkę skończoną funkcji dodatniej, taką jak funkcja beta : instynktownie definiują gęstość: f ( s | x , y ) = s x - 1 ( 1 - s ) y - 1
Robią to przez cały czas tak często, że dzieje się to odruchowo, nawet bez zastanowienia. Nazywają tę procedurę „normalizacją” lub podobnymi nazwami. Zauważ, że z definicji trywialnie gęstość ma wszystkie właściwości, które ma mieć, takie jak zawsze dodatnie i sumuje się do jednej.
AKTUALIZACJA
@ Whuber pyta, co jest takiego specjalnego w dystrybucji Beta, podczas gdy powyższą logikę można zastosować do nieskończonej liczby odpowiednich całek (jak zauważyłem w mojej odpowiedzi powyżej)?
Część specjalna pochodzi z rozkładu dwumianowego . Napiszę jego plik PDF, używając notacji podobnej do mojej wersji beta, a nie zwykłej notacji dla parametrów i zmiennych:
Tutaj - liczba sukcesów i niepowodzeń, a - prawdopodobieństwo sukcesu. Możesz zobaczyć, jak to jest bardzo podobne do licznika w dystrybucji Beta. W rzeczywistości, jeśli szukasz wcześniejszej wersji dla dystrybucji dwumianowej, będzie to dystrybucja Beta. Nie jest to zaskakujące również dlatego, że domena Beta ma wartość od 0 do 1, i to właśnie robisz w twierdzeniu Bayesa: całkuj przez parametr , co jest prawdopodobieństwem sukcesu w tym przypadku, jak pokazano poniżej: tutaj - podane prawdopodobieństwo (gęstość) prawdopodobieństwa sukcesu wcześniejsze ustawienia dystrybucji Beta orazx,y s s
źródło
Thomas Bayes (1763) wyprowadził rozkład Beta [bez użycia tej nazwy] jako pierwszy przykład rozkładu bocznego , poprzedzający prace Leonharda Eulera (1766) nad całką beta wskazaną przez Glen_b o kilka lat, ale całka pojawia się również w Euler (1729 lub 1738) [Opera Omnia, I14, 1 {24] jako sposób na uogólnienie funkcji silniowej może dlatego normalizująca stała Beta jest również nazywana funkcją Eulera . Davies− B(a,b) − wspomina Wallisa (1616-1703), Newtona (1642-1726) i Stirlinga (1692-1770) zajmujących się szczególnymi przypadkami całki jeszcze wcześniej. Karl Pearson (1895) po raz pierwszy skatalogowane tej rodziny rozkładów jak Pearson typu I .
Chociaż historycznie nie pojawiał się w tej kolejności, intuicyjny wpis do rozkładu Beta odbywa się za pomocą rozkładu Fishera , co odpowiada rozkładowi stosunku gdzie celowo użyłem zwykłych notacji dla estymatorów wariancji, ponieważ w ten sposób rozkład ten pojawił się i był zmotywowany do testowania równości dwóch wariancji. Następnie podczas gdy przeciwnie, jeśli , to Znajdowanie gęstościF(p,q)
źródło
Po pierwsze, nie jestem dobry w matematycznie precyzyjnych opisach pojęć w mojej głowie, ale postaram się jak najlepiej, używając prostego przykładu:
Wyobraź sobie, że masz łuk, wiele strzał i cel. Powiedzmy dalej, że twój współczynnik trafień (dla trafienia w cel) jest dokładnie funkcją odległości do środka celu i następującej postaci gdzie x jest odległością do środka celu ( ). Dla byłoby to przybliżenie pierwszego rzędu Gaussa. Oznaczałoby to, że najczęściej trafiasz w dziesiątkę. Podobnie, przybliża każdą krzywą w kształcie dzwonu, na przykład wynikającą z dyfuzji cząstek Browna.λ λ=g(x)=λmax−(q|x−x0|)1q, q>0, 0≤λ≤λmax x0 q=1/2
Załóżmy ponadto, że ktoś naprawdę odważny / głupi próbuje cię oszukać i przesuwa cel na każdym strzale. W ten sposób sam jest zmienną losową. Jeśli rozkład ruchów tej osoby można opisać mocą (p-1) (to znaczy ), prosty transformacja zmiennych losowych (pamiętaj ) prowadzi do rozproszonego Beta :x0 g(x) P(x0)=C⋅g(x)p−1) P(λ)dλ=P(x0)dx0 λ
gdzie stała normalizacyjna jest funkcją beta. Dla standardowej parametryzacji rozkładu beta ustawiamy .C′ λmax=1
Innymi słowy, rozkład beta można postrzegać jako rozkład prawdopodobieństw w środku rozłożonego rozkładu.
Mam nadzieję, że to pochodzenie zbliża się do tego, co miał na myśli twój instruktor. Zauważ, że formy funkcjonalne i są bardzo elastyczne i sięgają od rozkładów podobnych do trójkątów i rozkładów w kształcie litery U (patrz przykład poniżej) do rozkładów o ostrych pikach.g(x) P(x0)
FYI: Odkryłem to jako efekt uboczny w mojej pracy doktorskiej i pisałem o tym w mojej pracy doktorskiej w kontekście niestacjonarnych krzywych strojenia neuronowego prowadzących do rozkładów liczby impulsów o zerowym napompowaniu (bimodalny z trybem zerowym). Zastosowanie opisanej powyżej koncepcji dało rozkład mieszaniny Beta-Poissona dla aktywności neuronowej. Taki rozkład może być dopasowany do danych. Dopasowane parametry pozwalają oszacować zarówno rozkład jak i rozkład drgań poprzez zastosowanie odwrotnej logiki. Mieszanina Beta-Poissona jest bardzo interesującą i elastyczną alternatywą dla powszechnie stosowanego ujemnego rozkładu dwumianowego (który jest mieszaniną Gamma-Poissona) w celu modelowania nadmiernej dyspersji. Poniżej znajduje się przykład „Jitterg(x) p(x0) → Beta ”- pomysł w działaniu:
Odp . : Symulowane przemieszczenie próbne 1D na podstawie rozkładu drgań we wkładce ( ). Uśrednione podczas próby pole rażenia (ciągła czarna linia) jest szersze i ma niższy współczynnik szczytowy w porównaniu z leżącą u podstaw krzywą strojenia bez drgań (ciągła niebieska linia, użyte parametry: . B : Wynikowy rozkład przy w N = 100 próbach i analityczny pdf rozkładu Beta C. C : Symulowany rozkład liczby skoków z procesu Poissona z parametrami gdzie oznaczam wskaźniki z prób i wynikowy rozkład Beta-Poissona wyprowadzony jak naszkicowano powyżej.P(jitter)∝g(x)p−1 λmax=10,p=.6,q=.5 λ x 0 λ iλ x0 λi D : Analogiczna sytuacja w 2D z losowymi kątami przesunięcia prowadzącymi do identycznych statystyk.
źródło