Myśl jak bayesian, sprawdź jak częsty: co to znaczy?

35

Patrzę na niektóre slajdy wykładowe na kursie danych, który można znaleźć tutaj:

https://github.com/cs109/2015/blob/master/Lectures/01-Introduction.pdf

Niestety nie widzę wideo z tego wykładu iw pewnym momencie na slajdzie prezenter ma następujący tekst:

Niektóre kluczowe zasady

Myśl jak Bayesian, sprawdź jak Frequentist (pojednanie)

Czy ktoś wie, co to właściwie oznacza? Mam wrażenie, że z tych dwóch szkół myśli można się dobrze zapoznać.

Luca
źródło
2
Pomyśl, że może to mieć związek ze sprawdzaniem modelu: zobacz Dlaczego Bayesjanin nie może patrzeć na pozostałości? .
Scortchi - Przywróć Monikę
@Scortchi Z tego, co zbieram, czy nie ma to związku z oddzieleniem zestawów danych dotyczących szkolenia, sprawdzania poprawności i testów, czy może Bayesian nie może dostosowywać priorytetów nawet podczas fazy szkolenia modelu (aby użyć terminu ML tutaj). Jednak nadal jestem zdezorientowany, co to znaczy sprawdzać jak częsty ...
Luca
1
„Właściwy” Bayesian nigdy nie zmienia swoich priorytetów, a jedynie aktualizuje je zgodnie z nowymi informacjami, używając Twierdzenia Bayesa. Ale zgaduję tylko, o czym może być ta „kluczowa zasada”.
Scortchi - Przywróć Monikę
4
Nie udało mi się załadować linku. Sądzę, że mają na myśli, że nawet jeśli stosujesz metody bayesowskie, powinieneś zadbać o charakterystykę operacyjną Frequentist: jeśli generujesz 95% wiarygodnych przedziałów, które są wyjątkowo ciasne, ale w praktyce obejmują prawdziwy parametr będący przedmiotem zainteresowania przez 20% czasu, powinieneś się martwić? Zbyt sztywny Bayesian mógłby powiedzieć „nie” (ale tak naprawdę istnieje bardzo niewielu Bayesian o takiej sztywności).
Cliff AB
3
Patrząc w przyszłość na kolejne slajdy, popierają empiryczne Bayes. Można to zobaczyć na następującym zestawie slajdów
Cliff AB

Odpowiedzi:

32

Główna różnica między bayesowskimi a częstymi szkołami statystycznymi wynika z różnicy w interpretacji prawdopodobieństwa. Prawdopodobieństwo Bayesa to stwierdzenie o osobistym przekonaniu, że wydarzenie miało (lub miało) miejsce. Częstym prawdopodobieństwem jest stwierdzenie o odsetku podobnych zdarzeń, które występują w limicie wraz ze wzrostem liczby tych zdarzeń.

Dla mnie „myślenie jak bayesianin” oznacza aktualizowanie twojego osobistego przekonania w miarę pojawiania się nowych informacji i „sprawdzanie [lub martwienie się] jak częsty” - oznacza troskę o wykonanie procedur statystycznych zsumowanych w czasie ich stosowania, np. jaki jest zasięg wiarygodnych przedziałów, jaki jest poziom błędu typu I / II itp.

jaradniemi
źródło
1
Dziękuję za Twoją odpowiedź. Zwięzły i skuteczny nawet dla laika takiego jak ja!
Luca,
2
Czy nie jest możliwe sprawdzenie lub zmartwienie jak Bayesian poprzez badanie wpływu priorów lub użycie nieinformacyjnego? Czy dotyczy to tylko analiz sekwencyjnych? Dużo pracy poświęcono temu, gdzie statystyki bayesowskie i częstościowe przecinają się z analizami sekwencyjnymi, „aktualizacja przekonań” nie jest niezbędna, a statystyki sekwencyjne mogą być rygorystyczne w ustawieniach częstych.
AdamO,
1
Tak, można się martwić jak Bayesian, np. Badając wpływ swojego przeora. Nie, moja odpowiedź dotyczy nie tylko analiz sekwencyjnych, tzn. Nowe informacje mogą powstać naraz.
jaradniemi
15

Statystyki bayesowskie podsumowują przekonania, podczas gdy statystyki częstokrzyskie podsumowują dowody. Bayesianie postrzegają prawdopodobieństwo jako stopień przekonania. Ten obejmujący i generatywny rodzaj rozumowania jest użyteczny przy formułowaniu hipotez. Na przykład Bayesianie mogą być w stanie dowolnie przypisać pewne prawdopodobieństwo, że księżyc jest zrobiony z zielonego sera, niezależnie od tego, czy astronauci rzeczywiście mogli tam podróżować, aby to sprawdzić. Hipotezę tę może poprzeć pomysł, że z daleka księżyc wyglądajak zielony ser. Częstokroć nie mogą w pojedynkę wyobrazić sobie hipotezy, która jest czymś więcej niż tylko szaleńcem, ani też nie mogą powiedzieć, że dowody faworyzują jedną hipotezę nad drugą. Nawet maksymalne prawdopodobieństwo generuje jedynie statystyki, które są „najbardziej zgodne z tym, co zaobserwowano”. Formalnie statystyki bayesowskie pozwalają nam myśleć nieszablonowo i proponować możliwe do obrony pomysły na podstawie danych. Ale jest to ściśle generowana hipoteza w przyrodzie.

Statystyki często wykorzystywane są w celu potwierdzenia hipotez. Gdy eksperyment jest przeprowadzany dobrze, statystyki częstokrzyskie dostarczają „niezależnego obserwatora” lub „empirycznego” kontekstu do ustaleń poprzez unikanie priory. Jest to zgodne z filozofią nauki Karla Poppera. Istotą dowodów nie jest rozpowszechnianie określonego pomysłu. Mnóstwo dowodów jest zgodne z nieprawidłowymi hipotezami. Dowody mogą jedynie fałszować przekonania.

Wpływ priorów jest ogólnie uważany za błąd w rozumowaniu statystycznym. Jak wiecie, możemy znaleźć wiele przyczyn, dla których tak się dzieje. Psychologicznie wiele osób uważa, że ​​nasze uprzedzenia obserwatorów są wynikiem przeważających w naszym mózgu przeświadczeń, które powstrzymują nas przed naprawdę ważeniem tego, co widzimy. „Obserwacja chmur nadziei”, jak wielebna Matka powiedziała w Wydmie. Popper zaostrzył ten pomysł.

Miało to ogromne znaczenie historyczne w niektórych z największych eksperymentów naukowych naszych czasów. Na przykład John Snow skrupulatnie zebrał dowody na epidemię cholery i doszedł do wniosku, że cholera nie jest spowodowana deprywacją moralną, i wskazał, że dowody są wysoce zgodne z zanieczyszczeniem ścieków: zauważ, że nie doszedł do wniosku tym, odkrycia Snow poprzedzały odkrycie bakterii i nie było zrozumienia mechanistycznego ani etiologicznego. Podobny dyskurs znajduje się w Origin of Species. Nie wiedzieliśmy, czy księżyc jest zrobiony z zielonego sera, dopóki astronauci nie wylądowali na powierzchni i nie pobrali próbek. W tym momencie bocznianie bayesowscy przypisali bardzo, bardzo małe prawdopodobieństwo jakiejkolwiek innej możliwości, a internauci w najlepszym wypadku mogą powiedzieć, że próbki są wysoce niespójne z niczym innym, jak pyłem księżycowym.

Podsumowując, statystyki bayesowskie są podatne na generowanie hipotez, a statystyki częste - na potwierdzanie hipotez. Zapewnienie, że dane są gromadzone niezależnie w tych przedsięwzięciach, jest jednym z największych wyzwań, przed którymi stoją współczesni statystycy.

AdamO
źródło
1
Dziękuję za odpowiedź. Co miałeś na myśli, kiedy mówisz Plenty of evidence is consistent with incorrect hypotheses.
Luca
2
@Luca Często mylący jest przykład statystyczny. Na przykład, mogę powiedzieć: „Palenie daje nastolatkom lepszą funkcję płuc”. Mógłbym pójść dalej, aby to zracjonalizować, mówiąc, że palenie jest stymulantem, który zachęca do lepszej aktywności fizycznej, zdrowszego apetytu i zachęca do zdrowej socjalizacji. Gdybym zebrał dane, rzeczywiście pokazałyby, że nastolatki, które palą, mają lepszą czynność płuc. Wniosek asocjacyjny jest poprawny, ale wniosek przyczynowy jest fałszywy. Zależność jest pomieszana przez wiek, ponieważ starsze dzieci częściej palą.
AdamO,
Dziękuję Ci! Wiele się nauczyłem z tej bardzo dobrze napisanej odpowiedzi.
Luca,
5

Według Cliff ABkomentarza do PO, brzmi to tak, jakby zmierzali w kierunku empirycznej filozofii bayesowskiej. Istnieją trzy główne bayesowskie szkoły myślenia, a empiryczne bayes szacują priory na podstawie danych, często metodami częstokroć. To nie zgadza się dokładnie z cytatem (co implikuje Bayesa z góry, późniejsze obawy podobne do częstych), ale nie powinniśmy przeoczyć Cliff ABdoskonałego komentarza.

Poza tym istniała i może nadal istniała szkoła bayesowska, która myślała, że ​​nie trzeba niczego sprawdzać po procedurze bayesowskiej. Bardziej nowoczesna myśl wykorzystałaby późniejsze kontrole predykcyjne i być może takie podejście polega na podwójnym sprawdzaniu odpowiedzi.

Również filozofia częstokroć zajmuje się procedurami, a nie wnioskami z danych. Być może jest to również wskazówka na temat znaczenia cytatu.

Wayne
źródło
Myślę, że odniosłeś się do mojego pierwszego komentarza, a mój drugi komentarz był taki, że po dokładniejszym zbadaniu masz rację, że bardzo konkretnie odnoszą się do empirycznych Bayesa. Byłem naprawdę rozczarowany, że cytat był po prostu poparciem empirycznych Bayesów, a nie bardziej ogólnym wezwaniem do rozważenia zalet obu szkół myślenia. No cóż.
Cliff AB,
2

W kontekście tej klasy analizy danych moja interpretacja „sprawdzania jak częsty” jest taka, że ​​oceniasz wydajność swojej funkcji predykcji lub funkcji decyzyjnej w odniesieniu do przetrzymywanych danych walidacyjnych. Rada, by „myśleć jak bayesowski” wyraża opinię, że funkcja predykcyjna pochodząca z podejścia bayesowskiego ogólnie daje dobre wyniki.

DavidR
źródło
(gra adwokata diabła :) Dlaczego podejście bayesowskie powinno dawać „dobre wyniki”, a częste nie?
Tim
Metody bayesowskie mają charakter nakazowy. Statystyki częstokroć mogą być postrzegane jako część teorii decyzji i dają ramy do oceny dowolnej funkcji decyzyjnej (czy to w oparciu o zasadę bayesowską, czy jakąś częstotliwość). Pewne metody, takie jak metody największej wiarygodności, są często stosowane w kontekście częstych, ponieważ mają dobre właściwości częste (np. Asymptotycznie robią to dobrze i osiągają je szybciej niż większość innych metod). Metoda bayesowska z pewnością mogłaby być stosowana przez osoby często odwiedzające, ale mieliby inne powody, aby ją stosować.
DavidR
Metody bayesowskie mają również wiele wspólnego z teorią decyzji. Ja też nie , nie sądzę, że metody Bayesa może być stosowany w częstościowym kontekście - to raczej na odwrót (jak można sobie wyobrazić za pomocą prawdopodobieństwa a priori w częstościowym kontekście?): Wiele metod częstościowym mieć Bayesa interpretacje. Nie wydaje mi się, aby omawianie tego było słuszne, co mówię, że pańskie stwierdzenia nieco upraszczają sprawy.
Tim
Można udowodnić wiele fajnych właściwości częstokroć dotyczących podejść bayesowskich, więc w tym sensie robienie czegoś Bayesian jest całkiem bezpieczne, o ile masz wystarczającą ilość danych.
DavidR
1
Załóżmy, że chcę oszacować prawdopodobieństwo p głów w rzucie monetą. Jako Bayesian zacząłem od wcześniejszego prawdopodobieństwa p, obserwowałem pewne dane, a następnie dostałem a posterior na p. Musimy wymyślić oszacowanie punktowe p, i wybieram użycie średniej mojego rozkładu tylnego jako oszacowania punktowego. Podsumowując, opisuje to metodę przejścia od danych do oszacowania punktu. Metodę tę można ocenić często: np. Czy jest stronnicza? zgodny? asymptotycznie wydajny? Fakt, że uczestniczył przeor, nie powinien sam w sobie dotyczyć częstego.
DavidR
1

To brzmi jak „myśl jak Bayesian, sprawdź jak częsty” odnosi się do własnego podejścia w projektowaniu i analizie statystycznej. Jak rozumiem, myślenie bayesowskie wiąże się z pewnym przekonaniem o wcześniejszych sytuacjach (eksperymentalnie lub statystycznie), powiedzmy na przykład, że średnie wyniki czytania dla uczniów klas czwartych wynoszą 80 słów na minutę, a interwencja może zwiększyć je do 90 słów na minutę . Są to przekonania oparte na wcześniejszych badaniach i hipotezach. Myślenie częsty ekstrapoluje wyniki (interwencji), aby uzyskać przedziały ufności lub inne statystyki oparte na teoretycznej i praktycznej częstotliwości lub prawdopodobieństwie powtórzenia się tych wyników (tj. „Jak często”). Na przykład wynik czytania po interwencji może wynosić 91 słów na minutę z 95% przedziałem ufności wynoszącym 85 do 97 słów na minutę, a powiązana wartość p (wartość prawdopodobieństwa) jest różna od wyniku przed interwencją. Tak więc w 95% przypadków nowe wyniki czytania wyniosą od 85 do 97 słów na minutę po interwencji. Dlatego „myśl jak bayesowski” --- tj. Teoretyzuj, stawiaj hipotezy, spójrz na poprzednie dowody i „sprawdzaj jak częsty” - tj. Jak często pojawiałyby się te wyniki eksperymentów i jak prawdopodobne są one z powodu szansa zamiast interwencji. nowe wyniki czytania wyniosą od 85 do 97 słów na minutę po interwencji. Dlatego „myśl jak bayesowski” --- tj. Teoretyzuj, stawiaj hipotezy, spójrz na poprzednie dowody i „sprawdzaj jak częsty” - tj. Jak często pojawiałyby się te wyniki eksperymentów i jak prawdopodobne są one z powodu szansa zamiast interwencji. nowe wyniki czytania wyniosą od 85 do 97 słów na minutę po interwencji. Dlatego „myśl jak bayesowski” --- tj. Teoretyzuj, stawiaj hipotezy, spójrz na poprzednie dowody i „sprawdzaj jak częsty” - tj. Jak często pojawiałyby się te wyniki eksperymentów i jak prawdopodobne są one z powodu szansa zamiast interwencji.

Jeremy
źródło
2
Twoje ostatnie zdanie - „Sprawdź jak częstościowym” części - naprawdę nic wspólnego z częstościowym Otoczenie: szacunki Bayesa by również powiedzieć „jak często” oczekujemy coś występuje, albo „jak bardzo prawdopodobne”, to ...
Tim