Kim są częstokroć?

55

Mieliśmy już wątek z pytaniem, kim są Bayesianie, i jeden z pytaniem, czy częsterzy to Bayesianie , ale nie było wątku, w którym pytano bezpośrednio, kto jest częstokroć ? To pytanie zostało zadane przez @whuber jako komentarz do tego wątku i wymaga odpowiedzi. Czy istnieją (czy są jacyś samozidentyfikowani częstokroć)? Może zostały one wymyślone przez Bayesian, którzy potrzebowali kozła ofiarnego, aby obwinić je podczas krytykowania głównych statystyk?

Meta-komentarz do już udzielonych odpowiedzi: W przeciwieństwie do tego statystyki bayesowskie sądefiniowane nie tylko w kategoriach użycia twierdzenia Bayesa (także nie-Bayesianie), ani w subiektywistycznej interpretacji prawdopodobieństwa (nie nazwałbyś żadnego laika mówiąc rzeczy takie jak „Założę się, że szansa jest mniejsza niż 50:50!” Bayesian) - więc czy możemy zdefiniować częstość wyłącznie w kategoriach przyjętej interpretacji prawdopodobieństwa? Ponadto statystyki stosowane prawdopodobieństwo , więc powinna być definicja frequentism koncentruje się wyłącznie na interpretacji prawdopodobieństwa?

Tim
źródło
10
Nadal chciałbym wiedzieć, co to jest „Frequentist”? Widziałem ten termin jako oczywiste odniesienie do „każdego nie-bayesowskiego”, jak również do kogoś, kto zgadza się z filozofią prawdopodobieństwa częstokroć. Wiem, że istnieje wiele tych pierwszych, ale nie jestem pewien, czy istnieją żywi wykładnicy tych drugich!
whuber
9
Poproszę o zaliczenie mnie do częstego. Zjednoczmy się! Zjednoczeni, będziemy silni, by raz na zawsze zniszczyć Bayesian przy bramie!
Aksakal
10
@Aksakal powtórz to nieskończoną liczbę razy i uznam to za znaczące;)
Tim
5
Ostrożnie, kogo nazywacie Bayesian. Według DV Lindleya „Nie ma nikogo mniejszego niż Bayesian niż empiryczny Bayesian”. Wielu użytkowników tak zwanych metod bayesowskich nie jest tak naprawdę bayesowskimi. Teraz z szybkimi komputerami i MCMC wszyscy nagle są Bayesianami? Dla wielu jest to po prostu kolejne obliczenie, jak każda inna, a nie głęboko zakorzeniona filozofia. Czy populacja jest podzielona, ​​i tylko pomiędzy Frequentists i Bayesian. Co powiesz na kogoś bez odpowiedniego wykształcenia? Czy może istnieć stopień (lub częstotliwość) bayesizmu? Może różne w różnych dniach tygodnia lub rodzaje analiz?
Mark L. Stone,
10
Tim, obawiam się, że na ten wątek może mieć wpływ to samo zamieszanie, co niektóre powiązane wątki: mianowicie istnieją metody statystyczne częstokrzyskie vs bayesowskie i istnieją interpretacje prawdopodobieństwa częstokroć-bayesowskie. To są dwa różne problemy! O który pytasz? Zamieszanie jest już oczywiste w komentarzach do odpowiedzi @ fcop; fcop mówi o definicji / interpretacji prawdopodobieństwa, podczas gdy wspomniałeś o OLS i chodzi o metody statystyczne.
ameba mówi Przywróć Monikę

Odpowiedzi:

35

Niektóre istniejące odpowiedzi mówią o wnioskowaniu statystycznym, a niektóre o interpretacji prawdopodobieństwa, a żadna z nich nie czyni tego rozróżnienia. Głównym celem tej odpowiedzi jest dokonanie tego rozróżnienia.


Słowo „częsty” (i „częsty”) może odnosić się do DWÓCH RÓŻNYCH RZECZY:

  1. Jednym z nich jest pytanie, jaka jest definicja lub interpretacja „prawdopodobieństwa”. Istnieje wiele interpretacji, przy czym „interpretacja częstokroć” jest jedną z nich. Częstymi uczestnikami byliby ludzie przestrzegający tej interpretacji.

  2. Innym jest wnioskowanie statystyczne o parametrach modelu na podstawie zaobserwowanych danych. Istnieje bayesowskie i częste podejście do wnioskowania statystycznego, a częstymi są ludzie, którzy wolą stosować podejście częste.

Teraz pojawia się spekulacja: myślę, że prawie nie ma częstych pierwszego rodzaju (częstych P) , ale jest wielu częstych drugiego rodzaju (częstych S) .


Częstochowska interpretacja prawdopodobieństwa

Pytanie o prawdopodobieństwo jest przedmiotem intensywnej debaty o ponad 100-letniej historii. Należy do filozofii. Każdego, kto nie jest zaznajomiony z tą debatą, odsyłam do artykułu Interpretacje prawdopodobieństwa w Encyklopedii Filozoficznej Stanforda, który zawiera sekcję dotyczącą interpretacji częstych. Innym bardzo czytelnym rachunkiem, o którym się zorientowałem, jest ten artykuł: Appleby, 2004, Prawdopodobieństwo jest pojedynczym przypadkiem lub niczym - które jest napisane w kontekście podstaw mechaniki kwantowej, ale zawiera sekcje skupiające się na tym, jakie jest prawdopodobieństwo.

Appleby pisze:

Częstotliwość to pozycja, w której stwierdzenie prawdopodobieństwa jest równoważne stwierdzeniu częstotliwości o pewnym odpowiednio wybranym zespole. Na przykład, według von Misesa [21, 22] stwierdzenie „prawdopodobieństwo, że ta moneta zbliży się do głów wynosi 0,5”, jest równoważne stwierdzeniu „w nieskończonej sekwencji rzutów ta moneta pojawi się głów z ograniczającą częstotliwością względną 0,5” .

Może się to wydawać rozsądne, ale z tą definicją wiąże się tyle filozoficznych problemów, że prawie nie wiadomo od czego zacząć. Jakie jest prawdopodobieństwo, że jutro będzie padać? Pytanie bez znaczenia, bo jak mielibyśmy nieskończoną sekwencję prób. Jakie jest prawdopodobieństwo, że moneta w mojej kieszeni zbliży się do głów? Wiesz, względna częstotliwość głów w nieskończonej sekwencji rzutów? Ale moneta zużyje się, a Słońce przejdzie do supernowej, zanim sekwencja nieskończona zostanie ukończona. Powinniśmy więc mówić o hipotetycznej nieskończonej sekwencji. To prowadzi do dyskusji na temat klas referencyjnych itp. W filozofii nie można tak łatwo uciec. A tak przy okazji, dlaczego w ogóle limit miałby istnieć?

Co więcej, jeśli moja moneta wyskoczy w 50% przypadków w ciągu pierwszego miliarda lat, ale wtedy zacznie pojawiać się w głowach tylko w 25% przypadków (eksperyment eksperymentalny z Appleby)? Oznacza to, że z definicji. Ale zawsze będzie obserwacji F r e Q U e n c y ( H e d y ) 1 / 2 podczas kolejnych miliard lat. Czy uważasz, że taka sytuacja nie jest naprawdę możliwa? Jasne, ale dlaczego?P.(H.mizares)=1/4farmiqumindoy(H.mizares)1/2)Ponieważ nie może nagle zmienia? Ale zdanie to nie ma znaczenia dla P-częstych.P.(H.mizares)

Chcę, aby ta odpowiedź była krótka, więc zatrzymuję się tutaj; patrz wyżej dla referencji. Myślę, że naprawdę trudno jest zagorzałym P-częstym.

(Aktualizacja: w poniższych komentarzach @mpiktas podkreśla, że ​​dzieje się tak, ponieważ definicja częstokroć jest matematycznie bez znaczenia. Moja opinia wyrażona powyżej jest raczej taka, że ​​definicja częstokroć jest problematyczna filozoficznie .)


Częste podejście do statystyki

Rozważmy model probabilistyczny , który ma kilka parametrów θ i pozwala obliczyć prawdopodobieństwo obserwowania danych X . Zrobiłeś eksperyment i zaobserwować pewne dane X . Co możesz powiedzieć o θ ?P(Xθ)θXXθ

Częstotliwość S to pozycja, w której nie jest zmienną losową; jego prawdziwe wartości w świecie rzeczywistym są takie, jakie są. Możemy próbować oszacować je jako pewnego θ , ale nie możemy sensownie mówić o prawdopodobieństwie θ bytu w pewnym przedziale (np jest dodatni). Jedyną rzeczą, jaką można zrobić, to wymyślić procedury konstruowania jakiś przedział wokół naszej prognozy takie, że procedura ta udaje się obejmując prawda θ z określoną częstotliwością długookresowy sukces (zwłaszcza prawdopodobieństwo).θθ^θθ

Większość statystyk wykorzystywanych obecnie w naukach przyrodniczych opiera się na tym podejściu, więc z pewnością jest dziś wielu S-częstych.

(Aktualizacja: jeśli szukasz przykładu filozofa statystyki, w przeciwieństwie do praktyków statystyki, broniących punktu widzenia S-częstych, a następnie przeczytaj pisma Deborah Mayo; +1 do odpowiedzi @ NRH.)


AKTUALIZACJA: O związku między częstością P i częstością S.

@fcop i inni pytają o związek między częstością P a częstością S. Czy jedna z tych pozycji implikuje inną? Nie ma wątpliwości, że historycznie częstość S była rozwijana w oparciu o postawę częstości P. ale czy logicznie implikują się nawzajem?

Przed przystąpieniem do tego pytania powinienem powiedzieć, co następuje. Kiedy pisałem powyżej, że prawie nie ma P-częstych, nie miałem na myśli, że prawie wszyscy są P-subiektywnymi-bayesowskimi-la-de-finetti lub P-propensytistami-a-la-popper. W rzeczywistości uważam, że większość statystyk (lub badaczy danych lub uczących się maszyn) to P-nic-w ogóle lub P-zamknij się i kalkuluj (aby pożyczyć słynną frazę Mermina ). Większość ludzi ignoruje problemy z fundamentami. I jest w porządku. Nie mamy dobrej definicji wolnej woli, inteligencji, czasu lub miłości. Ale to nie powinno nas powstrzymywać od pracy nad neuronauką, AI, fizyką lub zakochaniem.

Osobiście nie jestem S-częstościowym, ale nie mam żadnych spójny pogląd na fundamentach prawdopodobieństwa.

Natomiast prawie każdy, kto wykonał jakąś praktyczną analizę statystyczną, jest albo S-częstym, albo S-Bayesianem (a może mieszanką). Osobiście publikowałem artykuły zawierające wartości i nigdy (jak dotąd) nie publikowałem artykułów zawierających priory i plakaty nad parametrami modelu, więc to czyni mnie częstym S, przynajmniej w praktyce.p

Jest zatem wyraźnie możliwe, aby być częstym S, nie będąc częstym P, pomimo tego, co @fcop mówi w swojej odpowiedzi.

W porządku. W porządku. Ale wciąż: czy P-bayesjanin może być S-częstym? I czy częsty P może być S-bayesianem?

Dla przekonanego P-bayesianin jest prawdopodobnie nietypowy, aby być S-częstym, ale w zasadzie całkowicie możliwe. Np. P-bayesjanin może zdecydować, że nie ma żadnych wcześniejszych informacji na temat a zatem zastosować analizę S-częstokształtną. Dlaczego nie. Każde twierdzenie S-częstoksera można z pewnością interpretować za pomocą P-bayesowskiej interpretacji prawdopodobieństwa.θ

Prawdopodobnie problem dla przekonanego P-częstokształtistki, który jest S-Bayesianem. Ale to jest bardzo problematyczne, aby być przekonanym P-częstym…

ameba mówi Przywróć Monikę
źródło
2
Komentarze nie są przeznaczone do rozszerzonej dyskusji; ta rozmowa została przeniesiona do czatu .
Glen_b
13

Praca Kołmogorowa nad Podstawami teorii prawdopodobieństwa ma sekcję zatytułowaną „Związek z danymi eksperymentalnymi” na s. 3. Oto co tam napisał:

wprowadź opis zdjęcia tutaj

wprowadź opis zdjęcia tutaj

Pokazuje, jak można odjąć jego aksjomaty, obserwując eksperymenty. Jest to dość częsty sposób interpretowania prawdopodobieństw.

Ma jeszcze jeden ciekawy cytat o niemożliwych wydarzeniach (puste zestawy):

wprowadź opis zdjęcia tutaj

Myślę więc, że jeśli nie masz ochoty na te argumenty, musisz przyznać, że jesteś częstym. Ta etykieta nie jest wyłączna. Możesz być paradygmatyczny (wymyśliłem to słowo), tzn. Zarówno częsty, jak i bayesowski. Na przykład, staję się bayesowski, kiedy stosuję metody stochastyczne do zjawisk, które z natury nie są stochastyczne.

AKTUALIZACJA Jak napisałem wcześniej w CV, sama teoria Kołmogorowa sama w sobie nie jest częsta. Jest równie kompatybilny z widokiem bayesowskim, jak z widokiem częstych. Umieścił ten słodki przypis w tej sekcji, aby wyjaśnić, że powstrzymuje się od filozofii:

wprowadź opis zdjęcia tutaj

Aksakal
źródło
1
cóż, większość systemów aksjomatycznych wywodzi się z „abstrakcyjnych” lub „uogólniających” koncepcji świata rzeczywistego. To samo dotyczy koncepcji (aksjomatów) „metryki”, przyjrzeli się koncepcji świata rzeczywistego (odległość eukildia) i „znaleźli” trzy właściwości, których używali jako „aksjomaty” w przestrzeni metrycznej. Ale twoja odpowiedź jest dobra (+1), pokazuje, że Kołmogorow nie „wymyślił” swoich aksjomatów „z powietrza”, opracował system aksjomatyczny, który był powiązany ze zrozumieniem, jaka była w tym czasie przydatność .
1
Czy mógłbyś spojrzeć na komentarze @mpiktas do tego pytania i powiedzieć, że sam Kołmogorow podał tę definicję? zobacz komentarze na stats.stackexchange.com/questions/230415/…
2
@ fcop, pamiętam jego odpowiedź. Wydawało się to rozsądne. Zdecydowanie można wyprowadzić aksjomaty Bayesa, a Kołmogorow pokazuje to w książce.
Aksakal
1
+1 Dokładnie to, co miałem na myśli (w szczególności przypis), kiedy pisałem komentarze do powiązanych wątków. Również ostatni komentarz @Aksakal.
Graeme Walsh
1
@Aksakal: odnosząc się do twojego komentarza powyżej: to nie była jego odpowiedź, ale moja :-)
8

Uważam, że warto wspomnieć o Deborah Mayo, która pisze na blogu Error Statistics Philosophy .

Nie twierdzę, że mam głębokie zrozumienie jej filozoficznej pozycji, ale ramy statystyk błędów , opisane w artykule z Arisem Spanosem, obejmują coś, co uważa się za klasyczne metody statystyki częstokroć. Aby zacytować artykuł:

Pod parasolem metod statystycznych błędów można uwzględnić wszystkie standardowe metody wykorzystujące prawdopodobieństwa błędu oparte na względnych częstotliwościach błędów w powtarzanym próbkowaniu - często nazywane teorią próbkowania lub statystyką częstościową .

W dalszej części tego samego artykułu można przeczytać:

W przypadku błędu istnieje prawdopodobieństwo, że statystyczny błąd nie mierzy stopnia potwierdzenia lub przekonania (rzeczywistego lub racjonalnego) w hipotezach, lecz określa ilościowo, jak często metody są w stanie rozróżnić alternatywne hipotezy i jak niezawodnie ułatwiają wykrycie błędu.

NRH
źródło
2
+1, Dobra robota, wspominając o blogu Mayo. Jest rzeczywiście najbardziej głośnym filozofem statystyki, który popiera statystyki częstokroć. Większość innych gadżetów w Internecie jest obecnie za statystykami bayesowskimi.
ameba mówi Przywróć Monikę
6

nnZAZAZAP.(ZA)

P.(ZA): =limn+nZAn

Nietrudno dostrzec, że ta definicja spełnia aksjomaty Kołmogorowa (ponieważ przyjmowanie limitów jest liniowe, patrz także Czy istnieje jakakolwiek * matematyczna * podstawa dla debaty bayesowskiej vs. częstej? ).

Aby podać taką definicję, muszą oni „wierzyć”, że ten limit istnieje. Dlatego częstymi są ci, którzy wierzą w istnienie tego limitu.

EDYCJA 31.08.2016: rozróżnienie między częstością S i P.

Ponieważ @amoeba rozróżnia w swojej odpowiedzi między S-częstymi i P-częstymi, gdzie P-częstiści są typem osób, które definiuję powyżej, i ponieważ twierdzi on również, że trudno jest być P-częstym , dodałem sekcję EDIT argumentować, że prawda jest odwrotna;

Twierdzę, że wszyscy S-częstych to P-częstiści .

θ

W swojej odpowiedzi stwierdza również, że P-częstolodzy są rzadkim gatunkiem.

P.(doja^θ)

Dlatego, zgodnie z jego definicją, każdy S-częsty jest również P-częsty. Dlatego dochodzę do wniosku, że osoby często występujące z P nie są tak rzadkie, jak twierdzi ameba.

θθ

θ

θ

Czy mogę również zapytać @mpiktas, który pisze w swoim komentarzu do odpowiedzi ameby:

„Bardzo trudno jest być częstym P, ponieważ praktycznie niemożliwe jest podanie matematycznie solidnej definicji takiego prawdopodobieństwa”

Jeśli potrzebujesz definicji P-częstości, aby zdefiniować S-częstość, to jak można być bardziej S-częstym niż P-częsty?

Społeczność
źródło
3
@Tim: dlaczego OLS miałby być „częstym”?
2
Jeśli tak, to cała dyskusja o tym, kto jest częstym, wydaje się nie mieć większego sensu, ponieważ ich zakres zainteresowań jest bardzo ograniczony, a ogromne obszary statystyki są poza ich zasięgiem ... (W tym wiele obszarów, które są interesujące Bayesians.) Co ja mówię, jest to, że nie wydaje się być definicja, ponieważ jest zbyt wąski.
Tim
2
limn+nZAn
1
ljamn+nZA/npH.ljamn+nZA/npH.
3
podstawy teorii prawdopodobieństwa właśnie z tego powodu, tj. podać pewne interpretacje prawdopodobieństwa solidnego tła matematycznego. Teraz chcesz wrócić i „odkryć na nowo” prawdopodobieństwo w swojej definicji „częstego”. Uważam to za mylące, dlatego głosuję za odpowiedzią na twoje odpowiedzi. Możesz to zignorować, tak działa strona, zawsze istnieje możliwość sporu.
mpiktas
4

Naprawdę ciekawe pytanie!

Umieściłem się w obozie dla częstych, jeśli chodzi o zrozumienie i interpretację twierdzeń o prawdopodobieństwie, chociaż nie jestem tak stanowczy co do potrzeby faktycznej sekwencji eksperymentów iid, aby uzasadnić to prawdopodobieństwo. Podejrzewam, że większość ludzi, którzy nie kupują tezy, że „prawdopodobieństwo jest subiektywną miarą wiary”, również myślałaby o prawdopodobieństwie w ten sposób.

P.(H.)=0,50,50,5

0,5

P.(H.)=0,5

W prostym przypadku, takim jak rzucanie monetami, widzimy, że częste i bayesowskie podejścia są funkcjonalnie równoważne, aczkolwiek filozoficznie bardzo różne. Jak zauważył Dikran Marsupial, Bayesian może w rzeczywistości wykorzystywać fakt, że empirycznie widzimy, jak monety wyskakują z głów tak często, jak widzimy, jak wychodzą z ogonów (wcześniejsza seria / duża częstotliwość próbkowania).

Co z rzeczami, które prawdopodobnie nie mogą mieć długofalowych częstotliwości? Na przykład, jakie jest prawdopodobieństwo, że Korea Północna rozpocznie wojnę z Japonią w ciągu najbliższych 10 lat? W przypadku częstych jesteśmy naprawdę pozostawieni w tyle, ponieważ nie jesteśmy w stanie tak naprawdę opisać rozkładów próbkowania wymaganych do przetestowania takiej hipotezy. Bayesian byłby w stanie poradzić sobie z tym problemem poprzez umieszczenie rozkładu prawdopodobieństwa nad możliwościami, najprawdopodobniej w oparciu o opinie ekspertów.

Pojawia się jednak kluczowe pytanie: skąd pochodzą te stopnie przekonania (lub zakładana wartość częstotliwości długoterminowej)? Argumentowałbym z psychologii i powiedziałbym, że te przekonania (szczególnie w obszarach dalekich od danych eksperymentalnych) pochodzą z tak zwanej heurystyki dostępności i heurystyki reprezentatywności . Istnieje wiele innych, które prawdopodobnie wchodzą w grę. Argumentuję to, ponieważ z powodu braku danych do skalibrowania naszych przekonań (w kierunku obserwowanej częstotliwości w długim okresie!) Musimy polegać na heurystyce, bez względu na to, jak wyrafinowane są.

Powyższe myślenie heurystyczne odnosi się w równym stopniu do Frequentists, jak i Bayesian. Interesujące jest dla mnie to, że niezależnie od naszej filozofii u podstaw pokładamy większą wiarę w coś, co naszym zdaniem jest bardziej prawdopodobne, i uważamy, że jest to bardziej prawdopodobne, ponieważ wierzymy, że jest więcej sposobów aby było to prawdą, lub wyobrażamy sobie, że ścieżki prowadzące do tego, że to prawda, zdarzałyby się częściej (często :-) niż te, które sprawiłyby, że to nieprawda.

Ponieważ jest to rok wyborczy, weźmy polityczny przykład: jakie przekonanie chcielibyśmy umieścić w stwierdzeniu „Ted Cruz zaproponuje karabiny szturmowe w ciągu najbliższych 4 lat”. Teraz mamy pewne dane na ten temat z jego własnych oświadczeń i prawdopodobnie opieralibyśmy naszą wcześniejszą wiarę w prawdziwość tego stwierdzenia bardzo blisko zera. Ale dlaczego? Dlaczego jego wcześniejsze wypowiedzi skłaniają nas do takiego myślenia? Ponieważ uważamy, że ludzie wysoce ideologiczni mają tendencję do „trzymania się broni” bardziej niż pragmatyczni odpowiednicy. Skąd to pochodzi? Prawdopodobnie z badań przeprowadzonych przez psychologów i naszych własnych doświadczeń z ludźmi o wysokich zasadach.

Innymi słowy, mamy pewne dane i przekonanie, że w większości przypadków, gdy ktoś taki jak Cruz mógłby zmienić zdanie, nie zrobi tego (ponownie, rodzaj oceny długoterminowej lub dużej próby).

Właśnie dlatego „układam” z częstymi. To nie moja niechęć do filozofii bayesowskiej (całkiem rozsądnej) lub metod (są świetne!), Ale że jeśli wystarczająco głęboko zagłębię się w to, dlaczego mam przekonania, które nie mają silnego poparcia dla dużych próbek, stwierdzę, że polegam na jakimś rodzaju modelu mentalnego, w którym wyniki można wyliczyć (jeśli w sposób dorozumiany) lub gdzie mogę powołać się na długoterminowe prawdopodobieństwa w danym podprocesie (np. republikanie głosują przeciwko środkom kontroli broni X% czasu), aby w ten czy inny sposób ważyć swoje przekonanie .

Oczywiście nie jest to tak naprawdę częsta częstotliwość i wątpię, aby wielu ludzi popierało interpretację prawdopodobieństwa tego listu przez von Miesesa. Myślę jednak, że pokazuje to podstawową zgodność prawdopodobieństwa Bayesa i Frequentisty: oba odwołują się do naszej wewnętrznej heurystyki odnośnie dostępności lub tego, co nazywam zasadą „Pachinko” dotyczącą częstotliwości wzdłuż łańcucha przyczynowego.

Być może powinienem więc nazwać się „dostępnym”, aby wskazać, że przypisuję prawdopodobieństwa na podstawie tego, jak często mogę sobie wyobrazić zdarzenie występujące jako wynik łańcucha zdarzeń (oczywiście z pewnym rygorem / modelowaniem). Jeśli mam dużo danych, świetnie. Jeśli tego nie zrobię, postaram się rozłożyć hipotezę na ciąg zdarzeń i wykorzystać posiadane przeze mnie dane (w razie potrzeby niepotwierdzone lub „zdrowy rozsądek”), aby ocenić, jak często wyobrażam sobie takie zdarzenie.

Przepraszam za długi post, świetne pytanie BTW!


źródło
1
Robisz ogromne uproszczenia dotyczące subiektywistycznego podejścia do prawdopodobieństwa. Zgadzam się, że psychologia odgrywa rolę w tym, jak pracujesz z danymi, ale możesz także dokonywać subiektywnie analiz w podejściu częstokroć. Niektórzy Bayesianie twierdzą, że w przypadku Bayesa przynajmniej wyrażasz swoje subiektywne przekonania, zamiast je ignorować.
Tim
1
@Tim Nie mówiłem, że częstokroć są bardziej obiektywni (zobacz moją pierwszą część na temat głównych założeń dla częstych). Zwróciłem też uwagę, że zarówno częstokrzyscy, jak i Bayesianie opierają swoje przekonania na tym, jak często coś się wydarzy lub ile rzeczy musi się wydarzyć (i ich indywidualne prawdopodobieństwo), aby coś się spełniło.
1
@ Czas, ponieważ nie jest to post o Bayesianism vs. Zasadniczo, wszyscy polegamy na heurystyce mentalnej, gdy myślimy o prawdopodobieństwie, i te heurystyki prowadzą nas do myślenia, że ​​niektóre rodzaje zdarzeń mogą mieć miejsce „na więcej sposobów” lub „są bardziej dostępne w sieci przyczynowej” niż inne.
1
@ Czas OK ... Dodałem kilka langugae, aby wyjaśnić, kiedy przechodzę od (krótkiej) dyskusji o bayesianizmie do mojej głównej gry.
4

Jak zauważył @amoeba , mamy częstokształtną definicję prawdopodobieństwa i częste statystyki . Wszystkie źródła, które do tej pory widziałem, mówią, że wnioskowanie częstych opiera się na częstokroć definiującej prawdopodobieństwo, tj. Zrozumieniu jej jako limitu proporcjonalności przy losowych losowaniach o nieskończonej liczbie (jak już zauważyli @fcop i @Aksakal cytując Kołmogorowa)

P.(ZA)=limnnZAn

Zasadniczo istnieje pojęcie pewnej populacji, z której możemy wielokrotnie pobierać próbki. Ten sam pomysł wykorzystuje się w wnioskach częstych. Przejrzałem kilka klasycznych artykułów, np. Jerzego Neymana , aby prześledzić teoretyczne podstawy statystyki częstokroć. W 1937 roku Neyman napisał

πππ

π
) mówimy o statystykach pobierających próbkę z badanej populacji.

W innej pracy (Neyman, 1977) zauważa, że ​​dowody przedstawione w danych należy zweryfikować, obserwując powtarzający się charakter badanego zjawiska:

Zwykle „weryfikacja” lub „walidacja” zgadywanego modelu polega na wydedukowaniu niektórych jego częstych konsekwencji w sytuacjach, które nie były wcześniej badane empirycznie, a następnie na przeprowadzeniu odpowiednich eksperymentów w celu sprawdzenia, czy ich wyniki są zgodne z przewidywaniami. Ogólnie rzecz biorąc, pierwsza próba weryfikacji jest negatywna: obserwowane częstotliwości różnych wyników eksperymentu nie są zgodne z modelem. Jednak w niektórych szczęśliwych przypadkach istnieje rozsądne porozumienie i odczuwa się satysfakcję z „zrozumienia” tego zjawiska, przynajmniej w jakiś ogólny sposób. Później niezmiennie pojawiają się nowe odkrycia empiryczne, wskazujące na nieadekwatność oryginalnego modelu i domagające się jego porzucenia lub modyfikacji. I to jest historia nauki!

aw kolejnym artykule Neyman i Pearson (1933) piszą o losowych próbkach pobranych z ustalonej populacji

W powszechnej praktyce statystycznej, gdy zaobserwowane fakty są określane jako „próbki”, a hipotezy dotyczą „populacji”, dla których próbki zostały dobrane, charakter próbek lub, jak to określimy, kryteria, które zostały określone wykorzystywane do testowania hipotez, wydają się często naprawiane przez szczęśliwą intuicję.

Częstotliwościowe statystyki w tym kontekście formalizują naukowe rozumowanie, w którym gromadzone są dowody, a następnie pobierane są nowe próbki w celu weryfikacji początkowych ustaleń, a gdy gromadzimy więcej dowodów, nasz stan wiedzy krystalizuje. Ponownie, jak opisano w Neyman (1977), proces obejmuje następujące kroki

( i ) Empiryczne ustalenie pozornie stałych długoterminowych częstotliwości względnych (lub „częstotliwości” w skrócie) zdarzeń uznanych za interesujące, ponieważ rozwijają się w naturze.
( ii ) Zgadywanie, a następnie weryfikowanie „mechanizmu przypadku”, którego powtarzane działanie wytwarza obserwowane częstotliwości. Jest to problem „częstokroć teorii prawdopodobieństwa”. Czasami ten krok jest oznaczony jako „budowanie modelu”. Oczywiście domniemany mechanizm prawdopodobieństwa jest hipotetyczny.
( iii ) Wykorzystanie hipotetycznego mechanizmu prawdopodobieństwa badanego zjawiska, aby wydedukować reguły dostosowywania naszych działań (lub „decyzji”) do obserwacji, aby zapewnić najwyższą „miarę” „sukcesu”. [... „zasad dostosowywania naszych działań” stanowi problem matematyki, w szczególności statystyki matematycznej.

Częstotliwość planuje swoje badania, mając na uwadze losowy charakter danych i ideę powtarzania losowań ze stałej populacji, projektuje na ich podstawie metody i wykorzystuje je do weryfikacji swoich wyników (Neyman i Pearson, 1933),

Nie mając nadziei na ustalenie, czy każda osobna hipoteza jest prawdziwa, czy fałszywa, możemy szukać reguł rządzących naszym zachowaniem w odniesieniu do nich, w wyniku czego zapewniamy, że w długim okresie doświadczenia nie będziemy zbyt często się mylić.

Jest to związane z zasadą powtarzania próbkowania (Cox and Hinkley, 1974):

(ii) Zasada silnego powtarzania prób
Zgodnie z zasadą silnego powtarzania prób procedury statystyczne należy oceniać pod kątem ich zachowania w hipotetycznych powtórzeniach w tych samych warunkach. Ma to dwa aspekty. Miary niepewności należy interpretować jako częstotliwości hipotetyczne w długich powtórzeniach; kryteria optymalności należy sformułować pod kątem wrażliwego zachowania w hipotetycznych powtórzeniach.
Argumentem przemawiającym za tym jest to, że zapewnia ono fizyczne znaczenie wielkościom, które obliczamy, i zapewnia ścisły związek między analizą, którą wykonujemy, a modelem leżącym u jej podstaw, który jest uważany za reprezentujący „prawdziwy” stan rzeczy.

(iii) Słaba zasada powtarzania prób
Słaba wersja zasady powtarzania prób wymaga, abyśmy nie postępowali zgodnie z procedurami, które dla niektórych możliwych wartości parametrów dawałyby, w hipotetycznych powtórzeniach, mylące wnioski przez większość czasu.

Natomiast przy maksymalnym prawdopodobieństwie mamy do czynienia z próbką, którą mamy , aw przypadku Bayesa wyciągamy wnioski na podstawie próbki i naszych priorytetów, a gdy pojawią się nowe dane, możemy przeprowadzić aktualizację bayesowską. W obu przypadkach pomysł powtarzania próbkowania nie jest kluczowy. Częstotliwi polegają tylko na danych, które posiadają (jak zauważył @WBT ), ale pamiętają, że jest to coś losowego i należy o tym myśleć jako część procesu powtarzalnego pobierania próbek z populacji (na przykład przypomnijmy, jak zaufanie interwały są zdefiniowane).

W częstym przypadku pomysł powtarzania próbkowania pozwala nam oszacować niepewność (w statystykach) i umożliwia interpretację rzeczywistych zdarzeń w kategoriach prawdopodobieństwa .


Na marginesie zauważmy, że ani Neyman (Lehmann, 1988), ani Pearson (Mayo, 1992) nie byli tak czystymi bywalcami, jak moglibyśmy sobie wyobrazić. Na przykład Neyman (1977) proponuje użycie empirycznego bayesowskiego i maksymalnego prawdopodobieństwa do oszacowania punktu. Z drugiej strony (Mayo, 1992),

w odpowiedzi Pearsona (1955) na Fishera (i gdzie indziej w jego pracy) jest to, że w kontekście naukowym Pearson odrzuca zarówno uzasadnienie niskiego prawdopodobieństwa błędu w długim okresie [...]

Wydaje się więc, że nawet wśród ojców założycieli trudno jest znaleźć czystych częstych.


Neyman, J i Pearson, ES (1933). O problemie najskuteczniejszych testów hipotez statystycznych. Transakcje filozoficzne Royal Society A: nauki matematyczne, fizyczne i inżynierskie. 231 (694–706): 289–337.

Neyman, J. (1937). Zarys teorii estymacji statystycznej opartej na klasycznej teorii prawdopodobieństwa. Phil. Trans. R. Soc. Lond A. 236: 333–380.

Neyman, J. (1977). Prawdopodobieństwo częstego korzystania i statystyki częstych. Synthese, 36 (1), 97-131.

Mayo, DG (1992). Czy Pearson odrzucił filozofię statystyki Neymana-Pearsona? Synthese, 90 (2), 233–262.

Cox, DR i Hinkley, DV (1974). Statystyka teoretyczna. Chapman and Hall.

Lehmann, E. (1988). Jerzy Neyman, 1894 - 1981. Raport techniczny nr 155. Katedra Statystyki, University of Califomia.

Tim
źródło
1
+1 (już kilka dni temu). Dziękujemy za napisanie tego, jest tutaj kilka dobrych cytatów, a lista referencji jest bardzo przydatna. Z kolei zaktualizowałem teraz moją odpowiedź w kilku miejscach, ale przede wszystkim w celu wyjaśnienia związku między częstością P i S, jaką widzę. Z pewnością zgadzam się, że historycznie S-freq opierał się na pomysłach P-freq, jak tutaj argumentujesz, ale nie sądzę, że muszą się one ze sobą wiązać.
ameba mówi Przywróć Monikę
4

Pozwól, że dam odpowiedź, która łączy to pytanie z kwestią prądu i bardzo praktycznym znaczeniu - Medycyną Precyzyjną - a jednocześnie odpowiadając na nie dosłownie, jak zostało zadane: Kim są częste osoby?

Częstymi uczestnikami są ludzie, którzy mówią takie rzeczy jak [1] (moje podkreślenie):

Co oznacza 10% ryzyko zdarzenia w ciągu następnej dekady dla osoby, dla której zostało ono wygenerowane? Wbrew pozorom ten poziom ryzyka nie stanowi osobistego ryzyka tej osoby, ponieważ prawdopodobieństwo nie ma znaczenia w indywidualnym kontekście .

Dlatego częste osoby interpretują „prawdopodobieństwo” w taki sposób, że nie ma ono znaczenia w szczególnym kontekście, takim jak w przypadku konkretnego pacjenta . Mój komentarz PubMed Commons na temat [1] analizuje skręcenia, które jej częsty autorzy muszą poddać, aby odzyskać pozór prawdopodobieństwa podobnego do pojęcia opieki nad indywidualnym pacjentem. Obserwowanie, jak i dlaczego to robią, może okazać się bardzo pouczające, kto jest częstym . Również w dużej mierze nie pouczająca późniejsza wymiana w dziale Listy JAMA [2,3] jest pouczająca, jak ważne jest wyraźne rozpoznanie ograniczeń w częstych pojęciach prawdopodobieństwa i bezpośrednie ich zaatakowanietakie jak. (Żałuję, że wielu użytkowników CV może stwierdzić, że [1] leży za zaporą.)

Znakomita i bardzo czytelna książka [4] L. Jonathana Cohena odwdzięczy się wysiłkom każdego zainteresowanego pytaniem PO. Warto zauważyć, że książka Cohena została dziwnie cytowana przez [1] w związku z twierdzeniem, że „prawdopodobieństwo nie ma znaczenia w indywidualnym kontekście”, chociaż Cohen wyraźnie upomina ten pogląd w następujący sposób [4, s. 49]:

Teoretycy częstotliwości nie mogą też twierdzić, że wszystkie ważne prawdopodobieństwa są rzeczywiście ogólne, a nie pojedyncze. Często wydaje się bardzo ważne, aby móc obliczyć prawdopodobieństwo powodzenia wyrostka robaczkowego własnego dziecka ...


1] Sniderman AD, D'Agostino Sr RB i Pencina MJ. „Rola lekarzy w erze analizy predykcyjnej”. JAMA 314, no. 1 (7 lipca 2015 r.): 25–26. doi: 10.1001 / jama.2015.6177.PubMed

2] Van Calster B, Steyerberg EW i Harrell FH. „Prognozowanie ryzyka dla osób fizycznych”. JAMA 314, no. 17 (3 listopada 2015 r.): 1875–1875. doi: 10.1001 / jama.2015.12215. Pełny tekst

3] Sniderman AD, D'Agostino Sr RB i Pencina MJ. „Prognozy RIsk dla osób fizycznych - odpowiedź”. JAMA 314, nie. 17 (3 listopada 2015 r.): 1875–76. doi: 10.1001 / jama.2015.12221.Pełny tekst

4] Cohen, L. Jonathan. Wprowadzenie do filozofii indukcji i prawdopodobieństwa. Oxford: Nowy Jork: Clarendon Press; Oxford University Press, 1989. Link do zeskanowanych stron 46–53 i 81–83

David C. Norris
źródło
1
2] jest dostępny online: lirias.kuleuven.be/bitstream/123456789/513795/1/…
Tim
Podoba mi się cytat: „ryzyko można traktować jako subiektywny poziom, w który„ wierzy się ”lub„ przygotowuje się do postawienia ”na wystąpienie choroby lub zdarzenia, tak jak obstawia się przyszłe zdarzenia jednorazowe w grach sportowych ”. Dziękujemy za Twój wkład i referencje.
Tim
2
Wygląda na dobrą odpowiedź, ale jestem trochę zdezorientowany. Wierzę, że częstokroć zajmują się procedurami (eksperymentami), które teoretycznie można by przeprowadzać nieskończoną liczbę razy. Nie oznacza to, że nie mogą przewidzieć następnego rzutu monetą, tylko że ich obawy / zapewnienia koncentrują się na procesie. To prawda, że ​​powiedzieliby, że „USA wygrają Puchar Świata w tym roku” nie jest czymś, o czym mogliby cokolwiek powiedzieć, ale czy nie mogliby powiedzieć czegoś o appendektomii twojego dziecka - jest to unikalne w pewnym sensie, ale appendektomie na dzieci nie są.
Wayne
@Tim, dzięki za link, który zawiera zarówno [2], jak i [3]. Zaktualizowałem odpowiednio tekst mojej odpowiedzi.
David C. Norris
2
@Wayne, sugerowałbym, że powyższa odpowiedź ameby - z rozróżnieniem między procedurami statystycznymi zwyczajowo związanymi z „widokiem prawdopodobieństwa częstotliwości ” i tym widokiem częstotliwości sama w sobie - odpowiada na twój komentarz. Ludzie mogą korzystać z częstych procedur statystycznych, a mimo to interpretować i wykorzystywać wynikające z nich prawdopodobieństwa na różne sposoby lub subiektywistycznie. Wystarczy spojrzeć na ciągły błąd interpretacji wartości P jako „prawdopodobieństwa, że ​​hipoteza zerowa jest prawdziwa”, aby zobaczyć, że tak jest.
David C. Norris
3

„Frequentists vs. Bayesians” z XKCD (na licencji CC-BY-NC 2.5 ), kliknij, aby omówić:

'Detektor!  Co powiedziałby bayesowski statystyk, gdybym zapytał go, czy ... „[rzuć]” JESTEM WYKRYWACZEM NEUTRINO, A NIE OSŁONĄ LABIRYNTU.  POWAŻNIE, CZY MÓJ MÓJ SIĘ SPADŁ?  [roll] „... tak”.

Ogólnym celem przedstawionej tutaj filozofii częstokroć jest wiara w wyciąganie wniosków na temat względnego prawdopodobieństwa zdarzeń na podstawie wyłącznie („czysto”) na podstawie obserwowanych danych, bez „zanieczyszczania” tego procesu szacowania wcześniejszymi wyobrażeniami o tym, jak rzeczy powinny lub nie powinien być. Przedstawiając oszacowanie prawdopodobieństwa, częsty nie bierze pod uwagę wcześniejszych przekonań na temat prawdopodobieństwa zdarzenia, gdy dostępne są obserwacje wspierające obliczenie jego prawdopodobieństwa empirycznego. Częstotliwość powinien wziąć pod uwagę te podstawowe informacje przy podejmowaniu decyzji o progu działania lub wniosku.

Jak zwięźle napisał Dikran Marsupial komentarzu poniżej : „Cenną kreskówka (być może nieumyślnie), jest fakt, że nauka jest rzeczywiście bardziej złożona i nie możemy po prostu zastosować„ rytuału zerowego ”bez myślenia o wcześniejszej wiedzy”.

Jako kolejny przykład, próbując określić / zadeklarować, które tematy „trendy” na Facebooku, osoby często odwiedzające z zadowoleniem przyjęłyby bardziej czysto algorytmiczne podejście do liczenia , na które zmierza Facebook , zamiast starego modelu, w którym pracownicy opracowują tę listę częściowo na podstawie swoich własne poglądy na temat, które tematy według nich „powinny” być najważniejsze.

WBT
źródło
10
-1. Uwielbiam XKCD, ale bez komentarzy obawiam się, że będzie to tylko wprowadzać w błąd w tym wątku. I trzeba sporo komentarzy, aby poprawnie wyjaśnić, jakie są problemy związane z tym komiksem. Jeśli zapewnisz odpowiednią dyskusję, usunę głosowanie.
ameba mówi Przywróć Monikę
4
α
4
„Rytuał zerowy” to złe zastosowanie statystyk częstokroć, ale nie jest to problem z częstotliwością jako taką.
Dikran Marsupial
2
@Dikran Twoje komentarze wydają się (niepoprawnie) zrównać „Frequentist” z „użytkownikiem NHST”. Jest to rodzaj zamieszania, o który się martwiłem.
whuber
3
@luchonacho FWIW jest dyskusja na temat kreskówki XKCD tutaj stats.stackexchange.com/questions/43339/ ... Cenną rzeczą, którą kreskówka (być może nieumyślnie) robi, jest fakt, że nauka jest naprawdę bardziej złożona i nie możemy po prostu zastosować „zerowej” rytuał ”bez myślenia o wcześniejszej wiedzy.
Dikran Torbacz
3

(Uwaga, tylko stycznie istotna dla pytania i witryny).

Prawdopodobieństwo dotyczy obiektywnego statusu jednostki rzeczy . Rzeczy nie mogą mieć intencji i otrzymują swoje statusy z wszechświata. W przypadku rzeczy zdarzenie (nadające mu jego status) zawsze powinno się zdarzyć: wydarzenie już tam się zakończyło, nawet jeśli tak naprawdę jeszcze się nie wydarzyło - przeszłość przyszłości rzeczy, zwana także „przeznaczeniem” lub przypadkiem.

Ponownie, z wielkim prawdopodobieństwem, że fakt, imprezy - po jeszcze doszło, czy nie, nie ma znaczenia - to już tam [w przeciwieństwie do znaczenia , które nigdy nie jest tam]; i jako taki jest już niepotrzebny i zbędny. Fakt ten należy odrzucić, a jego unieważnienie nazywamy „zdarzeniem prawdopodobnym”. Każdy fakt na temat rzeczy sam w sobie ma swoją pierwotną nieprzekonującą stronę lub prawdopodobieństwo faktu (nawet fakt, który rzeczywiście się pojawił - rozpoznajemy to po niedowierzaniu). Nieuchronnie jesteśmy do pewnego stopnia „zmęczeni rzeczami” przedpsychicznie. Pozostaje zatem tylko oszacować to częściowe zanegowanie faktyczności, jeśli zajdzie taka potrzeba. Jednym ze sposobów kwantyfikacji jest policzenie. Innym jest zważyć. Częstochowiec przeprowadza lub wyobraża sobie szereg prób leżących przed nim, które odwraca twarzą, aby sprawdzić, czy zdarzenie rzeczywiście się wydarzy; on liczy. Bayesjan rozważa szereg motywów psychologicznych ciągnących go za sobą, które on przesyła; waży je jak rzeczy. Obaj mężczyźni są zajęci grą umysłu z ładunkiem / usprawiedliwieniem. Zasadniczo nie ma między nimi dużej różnicy.

Możliwość dotyczy moich możliwości na świecie. Możliwość jest zawsze moja (szansa na deszcz to mój problem z wybraniem parasola lub zmoknięcia) i nie dotyczy przedmiotu (tego, który uważam za możliwy lub mający taką możliwość), ale całego świata dla mnie. Możliwość zawsze wynosi 50/50 i zawsze jest przekonująca, ponieważ implikuje - albo wymaga wcześniejszego, albo pociąga za sobą - moją decyzję, jak się zachować. Same rzeczy nie mają intencji, a tym samym możliwości. Nie powinniśmy mylić naszych możliwości tych rzeczy z ich własnymi prawdopodobieństwami „determinizmu stochastycznego”. Prawdopodobieństwo nigdy nie może być „subiektywne” w sensie ludzkim.


Spostrzegawczy czytelnik może poczuć w odpowiedzi zamaskowany wykop na jasną odpowiedź w tym wątku, w którym @amoeba mówi, że myśli "there are almost no frequentists of the [probability definition] kind (P-frequentists)". Może być odwrotnie: bayesowskie definicje prawdopodobieństwa nie istnieją jako inna klasa. Ponieważ, jak przyznałem, bayesianie uważają wycinki rzeczywistości w taki sam sposób, jak częstokroć, za szereg faktów; tylko te fakty nie są eksperymentami, wcześniej wspomnienia „prawd” i „argumentów”. Ale takie formy wiedzy są oparte na faktach i można je tylko policzyć lub zważyć. Prawdopodobieństwo, które wznieca, nie jest syntetyzowane jako subiektywne, to znaczy antycypacja (być może „bayesowskie”), chyba że ludzkie oczekiwania (możliwość) wkracza na scenę, by się wtrącać. I @amoeba z niepokojem wpuszcza go, gdy wyobraża sobie jako „

ttnphns
źródło
0

Och, jestem częstym bywalcem przez wiele lat,
i spędziłem cały czas na odtwarzaniu danych ze słuchu,
ale teraz wracam z Bayesem w wielkim sklepie,
i nigdy więcej nie będę grał dla częstych.

Bo to nigdy nie jest, nigdy nie, nigdy więcej,
czy będę grał dla częstych, nie nigdy, nigdy więcej!

Poszedłem do laboratorium, w którym zwykłem się konsultować.
Dał mi trochę danych, powiedział „p dla nas”,
powiedziałem „Nie ma mowy, Jose” z lekkim uśmiechem,
wartości P i oczywiste po prostu się nie zgadzają!

Chór

Powiedziałem, że to twój przeor musimy rzucić światło,
a oczy badacza otworzyły się szeroko z zachwytem
. Powiedział: „Moje wcześniejsze poglądy są równie dobre jak reszta,
a na pewno czynnik Bayesa będzie najlepszy!”.

Chór

Wrócę do moich nauczycieli, wyznaję, co zrobiłem,
i poproszę ich o wybaczenie ich marnotrawnemu synowi,
ale kiedy wybaczą mi, jak często wcześniej,
nigdy więcej nie zagram dla częstych!

Chór

I to nie, nie, nigdy, nie, nie, nigdy więcej,
Czy zagram dla częstych, nie, nigdy, nigdy więcej!

Źródło: AE Raftery, w The Bayesian Songbook, pod redakcją BP Carlin, pod adresem http://www.biostat.umn.edu/ . Śpiewany do tradycyjnego ludowego utworu „The Wild Rover”. Cytat w Open University M347 Statystyka matematyczna, część 9.

Zupa Smaczna
źródło
2
Powinno to być raczej opublikowane tutaj: stats.stackexchange.com/questions/1337/statistics-jokes
Tim
Zgadzam się z @Tim i -1, ponieważ nie widzę, jak to się dodaje do obecnej dyskusji.
ameba mówi Przywróć Monikę