Częstotliwościowa definicja prawdopodobieństwa; czy istnieje formalna definicja?

10

Czy istnieje jakakolwiek formalna (matematyczna) definicja tego, co osoby często oceniające rozumieją pod „prawdopodobieństwem”? Czytam, że jest to względna częstotliwość występowania „na dłuższą metę”, ale czy istnieje jakiś formalny sposób jej zdefiniowania? Czy są jakieś znane odniesienia, w których mogę znaleźć tę definicję?

EDYTOWAĆ:

Z częstym (patrz komentarz @whuber i moje komentarze do odpowiedzi @Kodiologist i @Gememe Walsh poniżej tej odpowiedzi) mam na myśli tych, którzy „wierzą”, że istnieje ta względna częstotliwość w dłuższej perspektywie. Może to (częściowo) odpowiada również na pytanie @Tim


źródło
7
Wyjaśnij, co rozumiesz przez „Frequentist”. Zastosowania, które widziałem w innych wątkach, wskazują, że wiele osób nie ma spójnego lub jasnego zrozumienia tego, co może oznaczać ten termin. Dlatego definicja pomogłaby zachować trafność wszelkich odpowiedzi.
whuber
5
@whuber Myślę, że definicja częstokrzyskiego to „non-bayesian”, a Bayesian w większości przypadków to „non-częstes” :)
Tim
1
Ściśle powiązane: en.wikipedia.org/wiki/Empirical_probability
Silverfish
2
Chciałem powiedzieć, że ta stats.stackexchange.com/a/230943/113090 prawdopodobnie byłaby dla ciebie interesująca, ale potem zdałem sobie sprawę, że to ty napisałeś tę odpowiedź, więc nieważne. W każdym razie twój proces myślowy może zainteresować innych, którzy również mają takie samo pytanie jak ty (np. Ja) „czy istnieje formalna częstokroć definicja prawdopodobieństwa”
Chill2Macht
6
Nie jestem pewien, czy będę w stanie samodzielnie napisać odpowiedź, ale chciałbym zostawić tutaj ten sam link do wpisu do encyklopedii filozofii Stanforda na temat interpretacji prawdopodobieństwa, który zamieściłem pod twoją odpowiedzią w powiązanym wątku. Rozdział na temat interpretacji / definicji częstokrzyskich to dobra lektura. Mówi szeroko o różnych problemach pojęciowych, próbując podać częstokroć definicję prawdopodobieństwa.
ameba

Odpowiedzi:

4

TL; DR Wydaje się, że nie można zdefiniować częstokroć definicji prawdopodobieństwa zgodnej ze strukturą Kołmogorowa, która nie jest całkowicie okrągła (tj. W sensie logiki kołowej).

Nie za długo, więc przeczytałem: Chcę zająć się tym, co widzę jako potencjalne problemy z definicją prawdopodobieństwa kandydata na częstokroć pierwsze, można interpretować jedynie jako zmienną losową, więc powyższe wyrażenie nie jest precyzyjnie zdefiniowane w ścisłym znaczeniu. Musimy określić tryb zbieżności dla tej zmiennej losowej, czy to prawie na pewno, w prawdopodobieństwie, w rozkładzie, w średniej, czy w średniej kwadratowej.

limnnAn
nA

Ale wszystkie te pojęcia konwergencji wymagają pomiaru przestrzeni prawdopodobieństwa, aby były znaczące. Intuicyjnym wyborem byłoby oczywiście wybranie zbieżności prawie na pewno. Ma to tę cechę, że limit musi istnieć punktowo, z wyjątkiem zdarzenia o wartości zero. To, co stanowi zbiór miary zero, będzie zbieżne dla każdej rodziny miar, które są absolutnie ciągłe względem siebie - pozwala nam to zdefiniować pojęcie prawie pewnej zbieżności, czyniąc powyższą granicę rygorystyczną, a jednocześnie zachowując nieco agnostycyzmu w kwestii tego, co leży u jej podstaw miarą mierzalnej przestrzeni zdarzeń jest (tj. ponieważ może to być dowolna miara absolutnie ciągła w stosunku do wybranej miary). Zapobiegłoby to błędom w definicji, które wynikałyby z wcześniejszego ustalenia danego środka,

Jeśli jednak używamy prawie pewnej konwergencji, oznacza to, że ograniczamy się do sytuacji silnego prawa wielkich liczb (odtąd SLLN). Pozwólcie, że stwierdzę to twierdzenie (podane na str. 133 Chunga) dla odniesienia tutaj:

Niech będzie sekwencją niezależnych, identycznie rozmieszczonych zmiennych losowych. Mamy więc gdzie .{Xn}

E|X1|<SnnE(X1)a.s.
E|X1|=limsupn|Sn|n=+a.s.
Sn:=X1+X2++Xn

Powiedzmy, że mamy mierzalną przestrzeń i chcemy zdefiniować prawdopodobieństwo jakiegoś zdarzenia w odniesieniu do pewnej rodziny wzajemnie absolutnie ciągłych miar prawdopodobieństwa . Następnie za pomocą Twierdzenia Rozszerzenia Kołmogorowa lub Twierdzenia Rozszerzenia Ionescu Tulcea (myślę, że oba działają), możemy zbudować rodzinę przestrzeni produktów , po jednym dla każdego . (Zauważ, że istnienie nieskończonych przestrzeni iloczynu, które jest wnioskiem twierdzenia Kołmogorowa, wymaga, aby miarą każdej przestrzeni było , dlatego ograniczam się teraz do prawdopodobieństwa zamiast miar arbitralnych). Następnie zdefiniuj(X,F)AF{μi}iI{(j=1Xj)i}iIμi11Aj aby być zmienną losową wskaźnika, tj. która równa się jeśli występuje w tej kopii, a jeśli nie, innymi słowyZatem wyraźnie (gdzie oznacza oczekiwanie w odniesieniu do ), więc silne prawo dużych liczb w rzeczywistości stosuje się do (ponieważ budując1Aj0

nA=1A1+1A2++1An.
0Ei1Aj1Eiμi(j=1Xj)i1Ajsą dystrybuowane identycznie i niezależnie - należy pamiętać, że niezależna dystrybucja oznacza, że ​​miara przestrzeni produktu jest mnożona w odniesieniu do miar współrzędnych), więc otrzymujemy a zatem nasza definicja prawdopodobieństwa w odniesieniu do powinna oczywiście brzmieć .
nAnEi1A1a.s.
AμiE11A

Właśnie zdałem sobie sprawę, że chociaż sekwencja zmiennych losowych zbiegnie się prawie na pewno w odniesieniu do wtedy i tylko wtedy, gdy prawie na pewno w odniesieniu do , ( gdzie ) nie musi to oznaczać, że będzie zbieżny do tej samej wartości ; w rzeczywistości SLLN gwarantuje, że nie zrobi tego, chyba że co nie jest prawdą ogólnie.nAnμi1μi2i1,i2IEi11A=Ei21A

Jeśli jest w jakiś sposób „wystarczająco kanoniczny”, powiedzmy jak rozkład równomierny dla zbioru skończonego, to może to działa dobrze, ale tak naprawdę nie daje żadnych nowych informacji. W szczególności, dla rozkładu równomiernego, , tzn. Prawdopodobieństwo jest tylko proporcją punktów lub zdarzeń elementarnych w które należą do , co znowu wydaje mi się nieco okrągłe. W przypadku ciągłej zmiennej losowej nie widzę, jak moglibyśmy kiedykolwiek zgodzić się na „kanoniczny” wybór .μE1A=|A||X|AXAμ

To znaczy wydaje się, że sensowne jest zdefiniowanie częstotliwości zdarzenia jako prawdopodobieństwa zdarzenia, ale nie wydaje się sensowne definiowanie prawdopodobieństwa zdarzenia jako częstotliwości (przynajmniej bez bycia okrągłym). Jest to szczególnie problematyczne, ponieważ w rzeczywistości nie wiemy, jakie jest prawdopodobieństwo; musimy to oszacować.

Należy również zauważyć, że ta definicja częstotliwości dla podzbioru mierzalnej przestrzeni zależy od wybranej miary będącej przestrzenią prawdopodobieństwa; na przykład nie ma miary produktu dla niezliczonej liczby kopii wyposażonych w miarę Lebesgue'a, ponieważ . Podobnie miarą za pomocą kanonicznej miary iloczynu jest , która albo wysadza w nieskończoność, jeśli albo osiąga zero, jeśli , tzn. twierdzenia o rozszerzeniu Kołmogorowa i Tulcei są bardzo szczególnymi wynikami charakterystycznymi dla miar prawdopodobieństwa .Rμ(R)=j=1nX(μ(X))nμ(X)>1μ(X)<1

Chill2Macht
źródło
1
Dzięki za miłą odpowiedź (+1). Zgadzam się, że istnieją „problemy” z definicją pod względem długoterminowej częstotliwości względnej, co prawdopodobnie było jednym z powodów, dla których Kołmogorow rozwinął swoją Grundbegriffe. Jednak kiedy mówimy o częstych, musimy postawić się w przedziale czasowym przed teorią Kołmogorowa?
2
@ fcop Chyba szczerze mówiąc nie mam pojęcia. Wydaje mi się, że staram się powiedzieć, że nie rozumiem, w jaki sposób rygorystyczne uzasadnienie częstego rozumienia prawdopodobieństwa może prowadzić do przydatnej / nieokólnej definicji.
Chill2Macht
@ fcop Naprawdę doceniam hojną nagrodę - byłem w naprawdę złym humorze, zanim ją otrzymałem. Szczerze mówiąc, to mnie trochę podnieciło (w dobrym tego słowa znaczeniu). Znów bardzo to doceniam
Chill2Macht
nie wspominając o tym, twoja odpowiedź jest bardzo dobrze rozwinięta i matematycznie poprawna.
6

Nie sądzę, że istnieje matematyczna definicja, nie. Różnica między różnymi interpretacjami prawdopodobieństwa nie jest różnicą w matematycznym zdefiniowaniu prawdopodobieństwa. Prawdopodobieństwo można zdefiniować matematycznie w ten sposób: jeśli jest przestrzenią miary o , to prawdopodobieństwo dowolnego zdarzenia wynosi tylko . Mam nadzieję, że zgadzasz się, że ta definicja jest neutralna dla pytań takich jak to, czy powinniśmy interpretować prawdopodobieństwa w sposób częsty czy bayesowski.(Ω,Σ,μ)μ(Ω)=1SΣμ(S)

Kodiolog
źródło
to dobrze, ale ta definicja prawdopodobieństwa jako która spełnia aksjomaty Kołmogorowa, jest bardzo abstrakcyjna, należy ją zdefiniować w określonych przypadkach. Jest to to samo, co „okrąg jest zbiorem punktów znajdujących się w określonej odległości od stałego punktu”. To nic nie znaczy, o ile nie mówisz, w której przestrzeni metrycznej jesteś: powinieneś powiedzieć, jaka jest definicja „odległości”. Myślę, że zdefiniowanie jako długoterminowej częstotliwości relatywnej spełnia aksjomaty Kołmogorowa, co sądzisz? PS Definicja w komentarzu @Silverfish również spełnia te aksjomaty. μP
(ciąg dalszy) więc w skrócie mogę zdefiniować ( zdefiniować to właściwe słowo), wiele które spełniają aksjomaty Kołmogorowa i są to wszystkie prawidłowe prawdopodobieństwa zgodnie z teorią aksjomatyczną. μ
Prawdopodobnie system Kołmogorowa zapewnia się aksjomatyczną podstaw - co niekoniecznie musi wiązać się częstościowym lub interpretację Bayesa. W duchu poglądów częstych, podstawową ideą jest to, że gdy liczba prób wzrasta do nieskończoności, częstotliwość empiryczna stabilizuje się lub zbliża do pewnej wartości; prawdopodobieństwo zdarzenia. Chociaż podejście oparte na częstotliwości poprawia podejście klasyczne, brak dyscypliny prowadzi do podstawy aksjomatycznej. Czy to bardziej pytanie o historię teorii prawdopodobieństwa?
limn(nA/n)=PA=P(A).
Graeme Walsh
@Graeme Walsh: czy mógłbyś udzielić odpowiedzi na to pytanie i uzupełnić go argumentami, dlaczego taka definicja jest zgodna z aksjomatami Kołmogorowa? (oczywiście można zakwestionować istnienie limitu, ale moglibyśmy powiedzieć, że częstymi są ci, którzy „wierzą” w jego istnienie?)P(A)
2
@fcop Jak zauważa Walsh, ta „definicja” nie jest rygorystyczna.
Kodiolog,