Jestem bardziej programistą niż statystykiem, więc mam nadzieję, że to pytanie nie jest zbyt naiwne.
Zdarza się to w losowych wykonaniach programu do pobierania próbek. Jeśli wezmę N = 10 losowo wybranych próbek stanu programu, zobaczyłem, że funkcja Foo jest wykonywana na przykład na I = 3 z tych próbek. Interesuje mnie to, co mówi mi o faktycznym ułamku czasu F, który Foo wykonuje.
Rozumiem, że jestem dwumianowy ze średnim F * N. Wiem także, że biorąc pod uwagę I i N, F ma rozkład beta. W rzeczywistości zweryfikowałem programowo związek między tymi dwiema dystrybucjami, to znaczy
cdfBeta(I, N-I+1, F) + cdfBinomial(N, F, I-1) = 1
Problem polega na tym, że nie mam intuicyjnego wyczucia związku. Nie mogę „wyobrazić sobie”, dlaczego to działa.
EDYCJA: Wszystkie odpowiedzi były trudne, szczególnie @ whuber, które wciąż muszę omijać, ale uporządkowanie statystyk było bardzo pomocne. Niemniej jednak zdałem sobie sprawę, że powinienem zadać bardziej podstawowe pytanie: biorąc pod uwagę I i N, jaki jest rozkład dla F? Wszyscy zauważyli, że to Beta, którą znałem. W końcu doszedłem do wniosku z Wikipedii ( koniugat wcześniej ), że tak właśnie jest Beta(I+1, N-I+1)
. Po zbadaniu go za pomocą programu wydaje się być właściwą odpowiedzią. Chciałbym wiedzieć, czy się mylę. I nadal jestem zdezorientowany relacją między dwoma plikami cdf pokazanymi powyżej, dlaczego sumują się do 1, a nawet jeśli mają coś wspólnego z tym, co naprawdę chciałem wiedzieć.
źródło
Odpowiedzi:
Analiza danych statystycznych rzędu z niezależnie czerpie z rozkładu równomiernego. Ponieważ statystyki zamówień mają rozkłady Beta , szansa, że nie przekracza daje całka Beta n + 1 x [ k ] px[0]≤x[1]≤⋯≤x[n] n+1 x[k] p
(Dlaczego tak jest? Oto nie rygorystyczna, ale zapadająca w pamięć demonstracja. Szansa, że leży między i jest szansą, że spośród jednolitych wartości, z nich leży między a , przynajmniej jedna z nich leży między i , a reszta leży między i Aby uporządkować w nieskończenie małym , musimy wziąć pod uwagę przypadek, w którym dokładnie jedna wartość (mianowicie ) leży pomiędzy i a zatemx[k] p p+dp n+1 k 0 p p p+dp p+dp 1 dp x[k] p p+dp n−k wartości przekraczają . Ponieważ wszystkie wartości są niezależne i jednolite, prawdopodobieństwo to jest proporcjonalne do . Pierwsze zamówienie w jest równe , dokładnie całka rozkładu Beta. Termin można obliczyć bezpośrednio z tego argumentu jako współczynnik wielomianowy lub wyprowadzić pośrednio jako stała normalizująca całki).p+dp pk(dp)(1−p−dp)n−k dp pk(1−p)n−kdp 1B(k+1,n−k+1) (n+1k,1,n−k)
Z definicji zdarzenie oznacza, że wartość nie przekracza . Odpowiednio, co najmniej wartości nie przekracza : to proste (i mam nadzieję oczywiste) stwierdzenie zapewnia intuicję, której szukasz. Prawdopodobieństwo wyrażenia równoważnego wynika z rozkładu dwumianowego,x[k]≤p k+1st p k+1 p
Podsumowując , całka Beta dzieli obliczenie zdarzenia na serię obliczeń: znalezienie co najmniej wartości w zakresie , którego prawdopodobieństwo normalnie obliczilibyśmy z dwumianowym cdf, dzieli się na wzajemnie wyłączne przypadki, w których dokładnie wartości jest w zakresie a 1 wartość mieści się w zakresie dla wszystkich możliwych , , a jest nieskończenie małą długością. Podsumowanie wszystkich takich „okien” - czyli całkowanie - musi dawać takie samo prawdopodobieństwo jak dwumianowy plik cdf.k+1 [0,p] k [0,x] [x,x+dx] x 0≤x<p dx [x,x+dx]
źródło
Spójrz na pdf Dwumianowy jako funkcję : i pdf Beta jako funkcja : Prawdopodobnie widać że przy odpowiednim (całkowitym) wyborze dla i są one takie same. O ile mogę stwierdzić, to wszystko, co jest związane z tą relacją: sposób, w jaki wchodzi w dwumianowy plik pdf, nazywa się rozkładem beta.x
źródło
Jak można zauważyć, rozkład beta opisuje rozkład prawdopodobieństwa próbny parametru , natomiast rozkład dwumianowy opisuje podział wyniku parametr . Przepisując pytanie, pytałeś o to, dlaczego Oznacza to, że prawdopodobieństwo, że obserwacja plus jeden jest większa niż oczekiwana obserwacja, jest takie samo jak prawdopodobieństwo, że obserwacja plus jeden jest większa niż oczekiwana obserwacja.F I
Przyznaję, że może to nie pomóc w intuicyjnym sformułowaniu problemu, ale może pomaga przynajmniej zobaczyć, w jaki sposób obie dystrybucje wykorzystują ten sam podstawowy model powtarzanych prób Bernoulliego do opisania zachowania różnych parametrów.
źródło
W krainie Bayesian rozkład Beta jest sprzężony przed parametrem p rozkładu dwumianowego.
źródło
Nie mogę komentować innych odpowiedzi, więc muszę utworzyć własną odpowiedź.
Posterior = C * Prawdopodobieństwo * Prior (C jest stałą, która powoduje, że Posterior jest zintegrowany z 1)
Biorąc pod uwagę model, który wykorzystuje rozkład dwumianowy dla prawdopodobieństwa i rozkład Beta dla Prior. Produkt tych dwóch, który generuje posterior, jest także rozkładem beta. Ponieważ Prior i Posterior są zarówno wersjami beta, a zatem są rozkładami sprzężonymi . Prior (Beta) nazywany jest sprzężonym Priorem dla prawdopodobieństwa (dwumianowy). Na przykład, jeśli pomnożysz Beta przez Normalny, posterior nie będzie już Beta. Podsumowując, Beta i Binomial to dwa rozkłady, które są często używane w wnioskowaniu bayesowskim. Beta jest koniugatem przed dwumianowym, ale te dwie dystrybucje nie są podzbiorem ani nadzbiorem drugiej.
Kluczową ideą wnioskowania bayesowskiego jest to, że traktujemy parametr p jako zmienną losową z zakresu od [0,1], co jest sprzeczne z podejściem wnioskowania częstych, w którym traktujemy parametr p jako stały. Jeśli przyjrzysz się bliżej właściwościom dystrybucji Beta, zobaczysz, że jej średnia i tryb są określane wyłącznie przez i nieistotne dla parametru pα β . To, w połączeniu z jego elastycznością, powoduje, że Beta jest zwykle używana jako Prior.
źródło
Podsumowanie: Często mówi się, że dystrybucja Beta jest dystrybucją dystrybucji! Ale co to znaczy?
Zasadniczo oznacza to, że możesz naprawić i pomyśleć o jako funkcji . Poniższe obliczenia mówią, że wartość wzrasta od do po dostrojeniu od do . Szybkość wzrastania przy każdym wynosi dokładnie przy tym .n,k P[Bin(n,p)⩾k] p P[Bin(n,p)⩾k] 0 1 p 0 1 p β(k,n−k+1) p
Niech oznacza losową zmienną dwumianową z próbkami i prawdopodobieństwem powodzenia . Korzystając z podstawowej algebry mamyBin(n,p) n p
Ma również niezły dowód kombinatoryczny, pomyśl o tym jak o ćwiczeniu!
Więc mamy:
Uwaga Aby zobaczyć interaktywną wersję fabuły, spójrz na to . Możesz pobrać notebooka lub po prostu użyć linku Binder.
źródło