Rozumowanie bayesowskie i częste w prostym języku angielskim

339

Jak opisałbyś w prostym języku angielskim cechy odróżniające rozumowanie bayesowskie od częstościowego?

Daniel Vassallo
źródło
To pytanie o wyciąganie wniosków na temat poszczególnych graczy w kręgle, gdy masz dwa zestawy danych - wyniki innych graczy i wyniki nowego gracza, jest dobrym spontanicznym przykładem różnicy, którą moja odpowiedź próbuje rozwiązać prostym językiem angielskim.
Peter Ellis,
4
Być może niektórzy z was, dobrzy ludzie, mogliby również udzielić odpowiedzi na pytanie o bayesowskie i częste interpretacje, które jest zadawane na stronie philosophy.stackexchange.com .
Drux

Odpowiedzi:

197

Oto jak wytłumaczyłbym babci podstawową różnicę:

Zgubiłem telefon gdzieś w domu. Mogę użyć lokalizatora telefonu na podstawie przyrządu, aby zlokalizować telefon, a po naciśnięciu lokalizatora telefon zaczyna wydawać sygnał dźwiękowy.

Problem: Który obszar mojego domu powinienem wyszukać?

Uzasadnienie dla częstych

Słyszę pisk telefonu. Mam również model mentalny, który pomaga mi zidentyfikować obszar, z którego dochodzi dźwięk. Dlatego po usłyszeniu sygnału domyślam się, w jakim obszarze domu muszę szukać telefonu.

Uzasadnienie bayesowskie

Słyszę pisk telefonu. Teraz oprócz modelu mentalnego, który pomaga mi zidentyfikować obszar, z którego dochodzi dźwięk, znam także miejsca, w których w przeszłości zgubiłem telefon. Łączę zatem swoje wnioski za pomocą sygnałów dźwiękowych i wcześniejszych informacji o lokalizacjach, w których zgubiłem telefon w przeszłości, aby zidentyfikować obszar, który muszę wyszukać, aby zlokalizować telefon.

Flimzy
źródło
11
Podoba mi się ta analogia. Byłbym bardzo przydatny, gdyby istniało zdefiniowane pytanie (oparte na zbiorze danych), w którym odpowiedź uzyskiwana jest za pomocą rozumowania częstokroć, a odpowiedź uzyskiwana za pomocą bayesowskiego - najlepiej ze skryptem R do obsługi obu argumentów. Czy pytam za dużo?
Farrel,
15
Najprostsza rzecz, jaką mogę sobie wyobrazić, rzucając monetą n razy i oceniając prawdopodobieństwo głów (oznaczenie p). Załóżmy, że obserwujemy k głów. Zatem prawdopodobieństwo otrzymania k głów to: P (k głów w n próbach) = (n, k) p ^ k (1-p) ^ (nk) Wnioskowanie przez częstokroć maksymalizowałoby powyższe, aby uzyskać oszacowanie p = k / n. Bayesian powiedziałby: Hej, wiem, że p ~ Beta (1,1) (co jest równoważne z założeniem, że p jest jednakowe dla [0,1]). Tak więc zaktualizowane wnioskowanie to: p ~ Beta (1 + k, 1 + nk), a zatem bayesowskie oszacowanie p byłoby p = 1 + k / (2 + n) Nie wiem R, przepraszam.
41
Należy zauważyć, że z punktu widzenia częstych nie ma powodu, dla którego nie można włączyć wcześniejszej wiedzy do modelu. W tym sensie widok częstych jest prostszy, masz tylko model i niektóre dane. Nie ma potrzeby oddzielania wcześniejszych informacji od modelu.
Robby McKilliam
1
@ user28 Jako komentarz do twojego komentarza, jeśli , to częsty oszacowałby p = 0 (odpowiednio p = 1 ) po zobaczeniu wyniku k = 0 głów (odpowiednio k = 3 głów), tj. moneta jest dwugłowy lub dwustronny. Szacunki Bayesa 1 / 5 i 4 / 5 odpowiednio nie dopuszczają możliwość, że jest to nieco mniej stronniczy moneta. n=3)p=0p=1k=0k=3)1/54/5
Dilip Sarwate
3
@ BYS2 Język programowania o nazwie R.
użytkownik1205901
102

Język mocno w policzek:

Bayesian definiuje „prawdopodobieństwo” dokładnie w taki sam sposób, jak robi to większość niestatystów - mianowicie wskazanie prawdopodobieństwa zdania lub sytuacji. Jeśli zadasz mu pytanie, da ci bezpośrednią odpowiedź, przypisując prawdopodobieństwa opisujące prawdopodobne wyniki możliwych sytuacji w danej sytuacji (i poda jego wcześniejsze założenia).

Frequentist to ktoś, kto uważa, że ​​prawdopodobieństwa reprezentują częstotliwości długoterminowe, z którymi zdarzają się zdarzenia; w razie potrzeby wymyśli fikcyjną populację, z której twoją szczególną sytuację można by uznać za losową próbę, aby mógł w sposób znaczący mówić o częstotliwościach w długim okresie. Jeśli zadasz mu pytanie dotyczące konkretnej sytuacji, nie udzieli bezpośredniej odpowiedzi, a zamiast tego wypowie się na temat tej (prawdopodobnie wyobrażonej) populacji. Wielu statystyków, którzy nie są częstymi, łatwo pomylić odpowiedź i zinterpretować ją jako prawdopodobieństwo Bayesa dotyczące konkretnej sytuacji.

Należy jednak zauważyć, że większość metod Frequentist ma odpowiednik Bayesa, który w większości przypadków daje zasadniczo ten sam wynik, różnica jest w dużej mierze kwestią filozofii, aw praktyce jest to kwestia „koni na kursy”.

Jak można się domyślić, jestem Bayesianinem i inżynierem. ; o)

Dikran Torbacz
źródło
36
Jako nie-ekspert uważam, że kluczem do całej debaty jest to, że ludzie faktycznie rozumują jak Bayesianie. Musisz być wyszkolony, aby myśleć jak częsty człowiek, a nawet wtedy łatwo jest się wyślizgnąć i podać powód lub przedstawić swoje rozumowanie, jakby to było bayesowskie. „Istnieje 95% szans, że wartość mieści się w tym przedziale ufności”. Wystarczająco powiedziane.
Wayne,
8
Kluczem jest również zastanowienie się nad tym, jaki rodzaj lobbingu ma nazywać statystyka XX wieku „klasyczna”, podczas gdy statystyki, które Laplace i Gauss zaczęli stosować w XIX wieku, nie są…
gwr
3
Może zbyt długo zajmowałem się pracą dla częstych, ale nie jestem pewien, czy punkt widzenia Bayesa jest zawsze intuicyjny. Załóżmy na przykład, że jestem zainteresowany parametrami świata rzeczywistego, takimi jak średni wzrost populacji. Jeśli powiem „istnieje 95% szansa, że ​​parametr będący przedmiotem zainteresowania będzie w moim wiarygodnym przedziale”, a następnie odpowiemy na pytanie „Gdybyśmy stworzyli 100 takich przedziałów dla różnych parametrów, jaką część z nich chcielibyśmy zawrzeć prawdziwe wartości parametru? ”, fakt, że odpowiedź nie brzmi 95, musi być mylący dla niektórych osób.
Cliff AB
4
@CliffAB, ale dlaczego zadajesz drugie pytanie? Chodzi o to, że są to różne pytania, więc nic dziwnego, że mają różne odpowiedzi. Baysian może odpowiedzieć na oba pytania, ale odpowiedź może być inna (co wydaje mi się rozsądne). Częstotliwość może odpowiedzieć tylko na jedno pytanie (ze względu na restrykcyjną definicję prawdopodobieństwa), a zatem (domyślnie) używa tej samej odpowiedzi na oba pytania, co powoduje problemy. Wiarygodny przedział nie jest przedziałem ufności, ale Bayesian może skonstruować zarówno przedział wiarygodny, jak i przedział ufności.
Dikran Marsupial
4
Mój komentarz był odpowiedzią na Wayne'a; pomysł, że ludzie „naturalnie” myślą w kontekście bayesowskim, ponieważ łatwiej jest zinterpretować wiarygodny interwał. Chodzi mi o to, że chociaż łatwiej jest skonstruować właściwą interpretację wiarygodnego przedziału (tj. Mniej zupy słów), myślę, że statystycy równie często mogą się mylić co do tego, co to naprawdę znaczy.
Cliff AB
63

Bardzo nieuprzejmie powiedziałbym, że:

Frequentist: Pobieranie próbek jest nieskończone, a zasady podejmowania decyzji mogą być ostre. Dane są powtarzalną losową próbką - istnieje częstotliwość. Podstawowe parametry są stałe, tj. Pozostają stałe podczas tego powtarzalnego procesu próbkowania.

Bayesian: Nieznane ilości są traktowane probabilistycznie, a stan świata można zawsze aktualizować. Dane są obserwowane z zrealizowanej próbki. Parametry są nieznane i opisane probabilistycznie. Dane są naprawione.

Jest świetny post na blogu, który daje dokładny przykład tego, jak Bayesian i Frequentist poradziliby sobie z tym samym problemem. Dlaczego nie odpowiedzieć na problem sam, a następnie sprawdzić?

Problem (zaczerpnięty z bloga Panos Ipeirotis):

Masz monetę, która po obróceniu kończy głowę z prawdopodobieństwem p, a kończy ogonem z prawdopodobieństwem 1-p. (Wartość p jest nieznana.)

Próbując oszacować p, przerzucasz monetę 100 razy. Kończy głowę 71 razy.

Następnie musisz zdecydować o następującym wydarzeniu: „W ciągu następnych dwóch rzutów dostaniemy dwie głowy z rzędu”.

Czy mógłbyś się założyć, że wydarzenie się wydarzy lub że tak się nie stanie?

Graham Cookson
źródło
5
0,712)=0,5041
5
Na końcu tego postu na blogu jest napisane: „zamiast wcześniejszego użycia jednolitego rozkładu, możemy być jeszcze bardziej agnostyczni. W tym przypadku możemy użyć wcześniejszego rozkładu Beta (0,0). Taki rozkład odpowiada w przypadku, gdy jakikolwiek środek rozkładu jest równie prawdopodobny. W tym przypadku oba podejścia, bayesowski i częsty dają takie same wyniki ”. co tak naprawdę podsumowuje!
tdc
13
Duży problem z tym blogu jest nie odpowiednio scharakteryzować co non-Bayesa (ale racjonalne) decydent zrobi. To niewiele więcej niż słomiany mężczyzna.
whuber
1
@tdc: Przeor Bayesian (Jeffreys) to Beta (0,5, 0,5), a niektórzy powiedzieliby, że jest to jedyny uzasadniony przeor.
Neil G,
1
@mbb - precyzyjne.
digitgopher
42

Powiedzmy, że człowiek rzuca sześciościenną kostką i ma wyniki 1, 2, 3, 4, 5 lub 6. Ponadto mówi, że jeśli wyląduje na 3, da ci darmowy podręcznik.

Następnie nieformalnie:

Częstościowym byłoby powiedzieć, że każdy wynik ma równe 1 na 6 prawdopodobieństwo wystąpienia. Uważa, że ​​prawdopodobieństwo pochodzi z rozkładów częstotliwości w długim okresie.

Bayesa jednak powiedziałbym powiesić na sekundę, znam tego człowieka, on jest David Blaine, znany oszust! Mam wrażenie, że coś knuje. Powiem, że jest tylko 1% szansa, że ​​wyląduje na 3, ALE ponownie ocenię to przekonanie i zmienię je, im więcej rzuci kostką. Jeśli widzę, że inne liczby pojawiają się równie często, iteracyjnie zwiększę szansę z 1% do czegoś nieco wyższego, w przeciwnym razie jeszcze bardziej ją zmniejszę. Uważa prawdopodobieństwo za stopień wiary w propozycję.

Tony Breyal
źródło
24
Myślę, że częstokroć (werbalnie) wskazałby swoje założenia i unikałby jakichkolwiek przydatnych prognoz. Może powiedziałby: „Zakładając, że kość jest sprawiedliwa, każdy wynik ma równe szanse 1 na 6. Ponadto, jeśli rzuty są uczciwe, a David Blaine rzuci kostką 17 razy, istnieje tylko 5% szansa, że nigdy nie wyląduje na 3, więc taki wynik sprawiłby, że wątpię, czy kość jest sprawiedliwa. ”
Thomas Levine
Czy więc „prawdopodobieństwo” (jak w MLE) byłoby „prawdopodobieństwem” częstego?
Akababa
40

Trochę zabawy ...

Bayesian to ten, który niejasno spodziewa się konia i dostrzegając osła, mocno wierzy, że widział muła.

Z tej strony:

http://www2.isye.gatech.edu/~brani/isyebayes/jokes.html

i z tej samej strony fajny esej ...

„Intuicyjne wyjaśnienie twierdzenia Bayesa”

http://yudkowsky.net/rational/bayes

Brett
źródło
14
W takim przypadku częsty nie byłby tym, który zna stosunek populacji osłów, mułów i koni, a po zaobserwowaniu paczki mułów zaczyna obliczać wartość p, aby wiedzieć, czy nastąpił statystycznie istotny wzrost w stosunku populacji mułów.
Andrew
30

Bayesian jest proszony o stawianie zakładów, które mogą obejmować wszystko, z czego mucha szybciej czołgnie się po ścianie, do której lekarstwo uratuje większość istnień ludzkich lub którzy więźniowie powinni pójść do więzienia. Ma duże pudełko z rączką. Wie, że jeśli włoży do pudełka absolutnie wszystko, co wie, w tym swoją osobistą opinię, i przekręci klamkę, podejmie najlepszą możliwą decyzję.

Często odwiedzający proszeni są o pisanie raportów. Ma wielką czarną księgę zasad. Jeśli sytuacja, w której jest proszony o sporządzenie raportu, jest opisana w jego zbiorze przepisów, może on przestrzegać zasad i napisać raport tak starannie sformułowany, że w najgorszym przypadku jest on błędny, raz na 100 (lub raz na 20 lub jeden raz czas w jakiejkolwiek specyfikacji jego raportu).

Częsty odwiedzający wie (bo napisał o tym raporty), że Bayesian czasami robi zakłady, które w najgorszym przypadku, gdy jego osobista opinia jest błędna, mogą się źle skończyć. Częstochowiec wie również (z tego samego powodu), że jeśli stawia zakłady przeciwko Bayesianowi za każdym razem, gdy różni się od niego, to w dłuższej perspektywie przegra.

McDowella
źródło
„w dłuższej perspektywie przegra” jest niejednoznaczne. Zakładam, że „on” jest tutaj bayesianinem? Czy nie dorównaliby sobie na dłuższą metę - bayesian mógł się uczyć i zmieniać swój osobisty charakter, dopóki nie pasuje do faktycznych (ale nieznanych) faktów.
lucidbrot
26

Mówiąc wprost, powiem, że rozumowanie Bayesa i Frequentist wyróżniają się na dwa różne sposoby odpowiedzi na pytanie:

Jakie jest prawdopodobieństwo?

Większość różnic sprowadza się zasadniczo do tego, w jaki sposób każdy odpowiada na to pytanie, ponieważ zasadniczo określa on dziedzinę prawidłowych zastosowań teorii. Teraz nie możesz udzielić żadnej odpowiedzi w kategoriach „zwykłego angielskiego”, bez dalszego generowania dodatkowych pytań. Dla mnie odpowiedź brzmi (jak można się domyślić)

prawdopodobieństwo jest logiką

10. Dodatkowo rachunek prawdopodobieństwa można wyprowadzić z rachunku zdań. Jest to najbardziej zgodne z rozumowaniem „bayesowskim” - chociaż rozszerza ono również rozumowanie bayesowskie w aplikacjach, zapewniając zasady przypisywania prawdopodobieństw, a także zasady manipulowania nimi. Oczywiście prowadzi to do pytania uzupełniającego „czym jest logika?” dla mnie najbliższą rzeczą, jaką mógłbym dać jako odpowiedź na to pytanie, jest: „logika to sądy rozsądku osądu racjonalnego, z danym zestawem założeń” (co to jest racjonalna osoba? itd.). Logika ma te same funkcje, co rozumowanie bayesowskie. Na przykład logika nie mówi ci, co przyjąć lub co jest „absolutnie prawdziwe”. Mówi tylko, w jaki sposób prawda jednego zdania jest powiązana z prawdą drugiego. Zawsze trzeba dostarczyć logiczny system z „aksjomatami”, aby mógł on zacząć od wniosków. Mają także te same ograniczenia, że ​​można uzyskać arbitralne wyniki ze sprzecznych aksjomatów. Ale „aksjomaty” są niczym innym jak wcześniej ustalonymi prawdopodobieństwami1

W przypadku rozumowania częstych mamy odpowiedź:

prawdopodobieństwo to częstotliwość

chociaż nie jestem pewien, czy „częstotliwość” jest zwykłym angielskim terminem, w jakim jest tutaj używana - być może „proporcja” jest lepszym słowem. Chciałem dodać do częstej odpowiedzi, że prawdopodobieństwo zdarzenia jest uważane za rzeczywistą, mierzalną (obserwowalną?) Wielkość, która istnieje niezależnie od osoby / obiektu, który ją oblicza. Ale nie mogłem tego zrobić w „zwykły angielski” sposób.

Być może więc wersja „czysto angielska” różni się tym, że częste rozumowanie jest próbą rozumowania na podstawie „absolutnych” prawdopodobieństw, podczas gdy rozumowanie bayesowskie jest próbą rozumowania na podstawie „względnych” prawdopodobieństw.

Inna różnica polega na tym, że częste podstawy są bardziej niejasne w tłumaczeniu rzeczywistego problemu na abstrakcyjną matematykę teorii. Dobrym przykładem jest zastosowanie „zmiennych losowych” w teorii - mają one precyzyjną definicję w abstrakcyjnym świecie matematyki, ale nie ma jednoznacznej procedury, którą można by zastosować, aby zdecydować, czy jakaś zaobserwowana wielkość jest, czy nie jest „przypadkowa” zmienna".

Bayesowski sposób rozumowania, pojęcie „zmiennej losowej” nie jest konieczne. Rozkład prawdopodobieństwa jest przypisany do wielkości, ponieważ jest nieznany - co oznacza, że ​​nie można go wywnioskować logicznie na podstawie posiadanych informacji. Zapewnia to proste połączenie między obserwowalną wielkością a teorią - ponieważ „bycie nieznanym” jest jednoznaczne.

W powyższym przykładzie widać również kolejną różnicę w tych dwóch sposobach myślenia - „losowy” w porównaniu z „nieznanym”. „losowość” jest sformułowana w taki sposób, że „losowość” wydaje się być właściwością rzeczywistej ilości. I odwrotnie, „bycie nieznanym” zależy od tego, o którą osobę pytasz o tę ilość - stąd jest to właściwość statystysty dokonującego analizy. Daje to początek przymiotnikom „obiektywnym” i „subiektywnym”, często dołączanym do każdej teorii. Łatwo jest wykazać, że „losowość” nie może być własnością niektórych standardowych przykładów, po prostu prosząc dwóch częstych, którzy otrzymali różne informacje o tej samej ilości, o podjęcie decyzji, czy jest ona „losowa”. Jednym z nich jest zwykła urna Bernoulliego: częstownik 1 ma zasłonięte oczy podczas rysowania, podczas gdy częsty 2 stoi nad urną, obserwując częsty 1 wyciągający piłki z urny. Jeśli deklaracja „losowości” jest właściwością kulek w urnie, to nie może zależeć od odmiennej wiedzy częstokroć 1 i 2 - a zatem dwaj częsty powinni podać tę samą deklarację „losowy” lub „nieprzypadkowy” .

prawdopodobieństwo prawdopodobieństwa
źródło
3
Byłbym zainteresowany, gdybyś mógł przepisać to bez odniesienia do zdrowego rozsądku.
Peter Ellis
@PeterEllis - Co jest złego w zdrowym rozsądku? Wszyscy to mamy i zwykle głupotą jest nieużywanie jej ...
probabilityislogic
13
Jest zbyt kwestionowane, co to właściwie jest, i zbyt specyficzne kulturowo. „Zdrowy rozsądek” jest skrótem od wszystkiego, co jest postrzeganym rozsądnym sposobem robienia rzeczy w tej konkretnej kulturze (która zbyt często wydaje się daleka od sensowności dla innej kultury w czasie i przestrzeni), więc odwołanie się do niej w definicji ukrywa kluczowe pytania . Jest to szczególnie nieprzydatne w ramach definicji logiki (i tak, jak twierdzę, jest pojęciem „racjonalnej osoby” w tym szczególnym kontekście - szczególnie, jak sądzę, twoja definicja „racjonalnej osoby” byłaby logiczną osobą kto ma zdrowy rozsądek!)
Peter Ellis
4
Nie może go podać, jego argumentem jest to, że nie ma uniwersalnej definicji , tylko te specyficzne dla kultury. Dwie osoby z różnych środowisk kulturowych (w tym różne style edukacji statystycznej) prawdopodobnie będą miały dwa różne rozumienie tego, co rozsądne jest robić w danych sytuacjach.
naught101
2
Ta odpowiedź zawiera bryłki dobroci (jak to jest dla zwykłego angielskiego?), Ale nie wierzę (jak to jest, że jesteś Bayesianem!), Że następujące stwierdzenie jest prawdziwe: „Jeśli akceptujesz logikę ... musisz także zaakceptować Argumentacja bayesowska ”. Na przykład, jeśli pomyślisz, zamiast przełożyć abstrakcyjną teorię matematyki na świat rzeczywisty, przekonasz się, że podejście aksjomatyczne może być spójne zarówno z rozumowaniem częstym, jak i bayesowskim! Prawdopodobnie Kołmogorow w pierwszym przypadku i, powiedzmy, Jeffreys w drugim przypadku. W gruncie rzeczy logika teorii prawdopodobieństwa; nie jego interpretacja.
Graeme Walsh
21

W rzeczywistości uważam, że wiele filozofii wokół tego zagadnienia jest po prostu wspaniała. Nie ma to na celu odrzucić debaty, ale jest to słowo ostrożności. Czasami sprawy praktyczne mają pierwszeństwo - podam przykład poniżej.

Równie łatwo można argumentować, że istnieją więcej niż dwa podejścia:

  • Neyman-Pearson („częsty”)
  • Podejścia oparte na prawdopodobieństwie
  • W pełni bayesowski

Starszy kolega niedawno przypomniał mi, że „wiele osób w wspólnym języku mówi o częstych i bayesowskich. Myślę, że bardziej uzasadnione jest rozróżnienie oparte na prawdopodobieństwie i częste. Zarówno maksymalne prawdopodobieństwo, jak i metody bayesowskie są zgodne z zasadą prawdopodobieństwa, podczas gdy metody częste nie. „

Zacznę od bardzo prostego praktycznego przykładu:

P.(+|S.)=1
P.(doorrmidot|S.)=1
P.(-|H.)=0,95
P.(+|H.)=0,05

Test jest więc w 100% dokładny lub w 95% dokładny, w zależności od tego, czy pacjent jest zdrowy czy chory. Podsumowując, oznacza to, że test jest co najmniej w 95% dokładny.

Na razie w porządku. Są to stwierdzenia, które złożyłby częsty. Te stwierdzenia są dość proste do zrozumienia i prawdziwe. Nie ma potrzeby gofrować w związku z „interpretacją częstych”.

Ale rzeczy stają się interesujące, gdy próbujesz je odwrócić. Biorąc pod uwagę wynik testu, czego możesz dowiedzieć się o zdrowiu pacjenta? Biorąc pod uwagę wynik testu negatywnego, pacjent jest oczywiście zdrowy, ponieważ nie ma fałszywych wyników ujemnych.

Ale musimy również rozważyć przypadek, w którym test jest pozytywny. Czy wynik testu był pozytywny, ponieważ pacjent był chory, czy też wynik był fałszywie dodatni? To tutaj rozchodzą się osoby często podróżujące i bayesowskie. Wszyscy zgodzą się, że obecnie nie można na nie odpowiedzieć. Częstotliwość odmówi odpowiedzi. Bayesian będzie przygotowany na udzielenie odpowiedzi, ale najpierw musisz dać Bayesianowi wcześniej - tzn. Powiedzieć, jaka część pacjentów jest chora.

Podsumowując, następujące stwierdzenia są prawdziwe:

  • Dla zdrowych pacjentów test jest bardzo dokładny.
  • Dla chorych pacjentów test jest bardzo dokładny.

Jeśli jesteś zadowolony z takich oświadczeń, to korzystasz z częstych interpretacji. Może się to zmieniać w zależności od projektu, w zależności od rodzaju problemów.

Ale możesz chcieć zrobić różne stwierdzenia i odpowiedzieć na następujące pytanie:

  • Jak dokładny jest dla tych pacjentów, którzy uzyskali pozytywny wynik testu?

Wymaga to uprzedniego i bayesowskiego podejścia. Zauważ również, że jest to jedyne pytanie interesujące dla lekarza. Lekarz powie „Wiem, że pacjenci albo uzyskają wynik pozytywny, albo negatywny. Ja również teraz, gdy wynik ujemny oznacza, że ​​pacjent jest zdrowy i można go odesłać do domu. Jedynymi zainteresowanymi pacjentami są ci, którzy otrzymali pozytywny wynik - czy są chorzy ?.

Podsumowując: W przykładach takich jak ten Bayesian zgodzi się ze wszystkim, co powiedział częsty. Ale Bayesian będzie argumentował, że oświadczenia częstego użytkownika, choć prawdziwe, nie są zbyt przydatne; i będzie argumentować, że na użyteczne pytania można odpowiedzieć tylko z góry.

Częstotliwość rozważy kolejno każdą możliwą wartość parametru (H lub S) i zapyta „czy parametr jest równy tej wartości, jakie jest prawdopodobieństwo, że mój test jest poprawny?”

Bayesjan zamiast tego rozważy każdą możliwą zaobserwowaną wartość (+ lub -) z kolei i zapyta: „Jeśli wyobrażam sobie, że właśnie zaobserwowałem tę wartość, co mi to mówi o warunkowym prawdopodobieństwie H-w porównaniu do S?”.

Aaron McDaid
źródło
1
Czy masz na myśli, For sick patients, the test is NOT very accurate.że zapomniałeś NIE?
agstudy
1
W obu przypadkach jest bardzo dokładny, więc nie, nie zapomniałem ani słowa. W przypadku osób zdrowych wynik będzie prawidłowy (tj. „Negatywny”) w 95% przypadków. W przypadku chorych wynik będzie prawidłowy (tj. „Pozytywny”) w 95% przypadków.
Aaron McDaid,
Myślę, że „słabość” w maksymalnym prawdopodobieństwie polega na tym, że zakłada on jednolity uprzedni względem danych, podczas gdy „pełny Bayesian” jest bardziej elastyczny w tym, co można wybrać wcześniej.
Joe Z.
Aby zakończyć przykład, załóżmy, że 0,1% populacji jest chora na chorobę D, na którą badamy: nie jest to nasz wcześniejszy. Bardziej prawdopodobne jest, że około 30% pacjentów, którzy przychodzą do lekarza i mają objawy podobne do D, faktycznie ma D (może to być mniej więcej w zależności od szczegółów, takich jak to, jak często inna choroba ma te same objawy). 70% osób biorących udział w teście jest zdrowych, 66,5% otrzymuje wynik ujemny, a 30% / 33,5% jest chorych. Zatem biorąc pod uwagę wynik pozytywny, nasze prawdopodobieństwo tylne, że pacjent jest chory wynosi 89,6%. Następna łamigłówka: skąd wiemy, że 70% badanych ma D?
Qwertie
7

Statystyki bayesowskie i częstokrzyskie są kompatybilne, ponieważ można je rozumieć jako dwa ograniczające przypadki oceny prawdopodobieństwa przyszłych zdarzeń na podstawie przeszłych zdarzeń i założonego modelu, jeśli przyzna się, że w granicach bardzo dużej liczby obserwacji nie ma wątpliwości co do system pozostaje, i że w tym sensie bardzo duża liczba obserwacji jest równa znajomości parametrów modelu.

Załóżmy, że dokonaliśmy pewnych obserwacji, np. Wyniku 10 rzutów monetą. W statystyce bayesowskiej zaczynasz od tego, co zaobserwowałeś, a następnie oceniasz prawdopodobieństwo przyszłych obserwacji lub parametrów modelu. W statystykach częstych zaczynasz od pomysłu (hipotezy) tego, co jest prawdą, zakładając scenariusze dużej liczby poczynionych obserwacji, np. Moneta jest bezstronna i daje 50% głów do góry, jeśli rzucisz ją wiele razy. Opierając się na tych scenariuszach dużej liczby obserwacji (= hipoteza), oceniasz częstotliwość dokonywania obserwacji podobną do tej, którą robiłeś, tj. Częstotliwość różnych wyników 10 rzutów monetą. Dopiero wtedy bierzesz swój rzeczywisty wynik, porównujesz go z częstotliwością możliwych wyników i decydujesz, czy wynik należy do tych, które mają wystąpić z wysoką częstotliwością. W takim przypadku wnioskujesz, że dokonane obserwacje nie są sprzeczne z Twoimi scenariuszami (= hipoteza). W przeciwnym razie dojdziesz do wniosku, że dokonana obserwacja jest niezgodna z Twoimi scenariuszami, i odrzucasz hipotezę.

Tak więc statystyki bayesowskie zaczynają się od tego, co zaobserwowano i oceniają możliwe przyszłe wyniki. Częstotliwościowe statystyki rozpoczynają się od abstrakcyjnego eksperymentu tego, co można by zaobserwować, gdyby ktoś coś założył, i dopiero wtedy porównuje wyniki eksperymentu abstrakcyjnego z tym, co faktycznie zaobserwowano. W przeciwnym razie oba podejścia są kompatybilne. Obaj oceniają prawdopodobieństwo przyszłych obserwacji na podstawie niektórych poczynionych lub postawionych hipotez.

Zacząłem pisać w bardziej formalny sposób:

Pozycjonowanie wnioskowania bayesowskiego jako szczególnego zastosowania wnioskowania częstokrzyskiego i odwrotnie. figshare.

http://dx.doi.org/10.6084/m9.figshare.867707

Manuskrypt jest nowy. Jeśli zdarzy ci się to przeczytać i masz komentarze, daj mi znać.

user36160
źródło
6

Powiedziałbym, że patrzą na prawdopodobieństwo na różne sposoby. Bayesian jest subiektywny i wykorzystuje przekonania a priori do zdefiniowania wcześniejszego rozkładu prawdopodobieństwa na możliwych wartościach nieznanych parametrów. Opiera się więc na teorii prawdopodobieństwa, takiej jak deFinetti. Częstotliwość postrzega prawdopodobieństwo jako coś, co ma związek z ograniczającą częstotliwością opartą na obserwowanej proporcji. Jest to zgodne z teorią prawdopodobieństwa rozwiniętą przez Kołmogorowa i von Misesa.
Częstochowiec dokonuje wnioskowania parametrycznego, używając tylko funkcji prawdopodobieństwa. Bayesian bierze to i mnoży przez przeora i normalizuje je, aby uzyskać rozkład tylny, którego używa do wnioskowania.

Michael Chernick
źródło
4
+1 Dobra odpowiedź, ale należy podkreślić, że podejście bayesowskie i podejście częstotliwościowe różnią się pod względem interpretacji prawdopodobieństwa. Z kolei Kołmogorow stanowi aksjomatyczną podstawę teorii prawdopodobieństwa, która nie wymaga interpretacji (!) Takiej jak te stosowane przez Bayesian lub Frequentist. W pewnym sensie system aksjomatyczny ma swoje własne życie! Na podstawie samych sześciu aksjomatów Kołmogorowa nie sądzę, że można powiedzieć, że jego system aksjomatyczny jest albo bayesowski, albo częsty, i może w rzeczywistości być zgodny z obydwoma.
Graeme Walsh
0

Odpowiadam na to pytanie: częste osoby porównujące dane, które widzą, z oczekiwaniami. Oznacza to, że mają model mentalny określający częstotliwość coś powinno się zdarzyć, a następnie widzą dane i jak często to się zdarza. tzn. jak prawdopodobne są dane, które widzieli, biorąc pod uwagę wybrany przez nich model.

Z drugiej strony lud Bayesian łączy swoje modele mentalne. Oznacza to, że mają model oparty na swoich wcześniejszych doświadczeniach, który mówi im, jak według nich powinny wyglądać dane, a następnie łączą to z danymi, które obserwują, aby osądzić jakieś `` późniejsze '' przekonanie. tzn. znajdują prawdopodobieństwo, że model, który chcą wybrać, jest prawidłowy, biorąc pod uwagę zaobserwowane dane.

Demetrios Papakostas
źródło
-2

Frequentist: Prawdziwy stan natury to. Jeśli zwykle wykonuję takie analizy, 95% moich odpowiedzi będzie poprawnych.

Bayesian: Istnieje 95% szans na to, że prawdziwą odpowiedzią jest ... Opieram to na kombinacji danych, które mi dałeś i naszych wcześniejszych domysłów na temat tego, co jest prawdą.

Emil M. Friedman
źródło
-3

Frequentist: obstawianie kości. Tylko wartość kości decyduje o wyniku: wygrywasz zakład lub nie. W zależności od samej szansy.

Bayesian: gra w pokera Texas Hold'em. Jesteś jedynym, który widzi twoje dwie karty. Masz trochę wiedzy na temat innych graczy na stole. Musisz dostosować swoje prawdopodobieństwo wygranej na flopie, turnie i riverze i ewentualnie w zależności od tego, którzy gracze zostali. Czy często blefują? Czy są agresywnymi czy pasywnymi graczami? Wszystko to decyduje o tym, co robisz. To nie tylko prawdopodobieństwo otrzymania pierwszych dwóch kart, które zdecydują, czy wygrasz, czy nie.

Granie w pokera często oznacza, że ​​każdy gracz na początku pokazuje swoje ręce, a następnie stawia zakład lub pasuje przed pokazaniem kart na flopie, turnie i riverze. Teraz znowu zależy tylko od szansy, czy wygrasz, czy nie.

pisarz
źródło
-5

Powiedz, jeśli złapałeś ból głowy i idź do lekarza. Załóżmy, że w zestawie decyzyjnym lekarza istnieją dwie przyczyny bólu głowy, nr 1 dla guza mózgu (podstawowa przyczyna, która powoduje ból głowy w 99% przypadków) i nr 2 przeziębienia (przyczyna, która może powodować bóle głowy u bardzo niewielu pacjentów) .

Wtedy decyzje lekarzy oparte na częstym podejściu byłyby takie, że masz guz mózgu.

Decyzja lekarzy oparta na podejściu bayesowskim powie ci, że masz przeziębienie (nawet jeśli tylko 1% przeziębienia powoduje bóle głowy)

Yang Fu
źródło
1
(-1) Nie jest jasne, jaka jest różnica między „dokumentem dla częstych” a „dokumentem bayesowskim”. Nie widzę powodu, dla którego doktor często ignorowałby dane dotyczące zimnego bólu głowy. Dokument Bayesa w ogóle nie wydaje się używać twierdzenia Bayesa ani priorów, więc nie rozumiem, jak on jest Bayesianem?
Tim
Zbyt nieprawdopodobne, aby była użyteczną lub nawet zabawną analogią.
Nick Cox,
-6

Samiec i kotka są trzymane w stalowej komorze wraz z wystarczającą ilością jedzenia i wody na 70 dni.

Częstochowiec powiedziałby, że średni okres ciąży kotów wynosi 66 dni, kotka była w upale, kiedy koty były uwięzione, a raz w upale będzie się krzyżować przez 4 do 7 dni. Ponieważ prawdopodobnie nastąpiło wiele aktów rozmnażania i wystarczająco dużo czasu na ciążę, szanse są na to, że kiedy pudełko zostanie otwarte w dniu 70, jest miot noworodków.

Bayesian powiedziałby: słyszałem poważnego Marvina Gaye wychodzącego z pudełka pierwszego dnia, a potem rano usłyszałem wiele dźwięków przypominających kociaki. Tak więc, nie wiedząc wiele na temat rozmnażania kotów, istnieje prawdopodobieństwo, że kiedy pudełko zostanie otwarte w dniu 70, pojawi się miot noworodków.

Lew
źródło
Sposób, w jaki to napisałem, zwłaszcza że bayesianin nie wiedział zbyt wiele o rozmnażaniu kotów, na początku tylko częsty stawiał na kocięta. Istotnymi punktami mojego bardzo prymitywnego przykładu były przede wszystkim to, że częstokroć dokonał prognozy na podstawie danych na początku, a potem usiadł bez włączania nowych danych uzupełniających, podczas gdy bayesian nie miał zbyt wielu danych na początek, ale nadal włączał odpowiednie dane w miarę ich udostępniania.
Lew
3
... i dlaczego osoba spoza Bayesian też nie skorzysta z dodatkowych danych?
whuber