Patrzę na niektóre slajdy wykładowe na kursie danych, który można znaleźć tutaj:
https://github.com/cs109/2015/blob/master/Lectures/01-Introduction.pdf
Niestety nie widzę wideo z tego wykładu iw pewnym momencie na slajdzie prezenter ma następujący tekst:
Niektóre kluczowe zasady
Myśl jak Bayesian, sprawdź jak Frequentist (pojednanie)
Czy ktoś wie, co to właściwie oznacza? Mam wrażenie, że z tych dwóch szkół myśli można się dobrze zapoznać.
Odpowiedzi:
Główna różnica między bayesowskimi a częstymi szkołami statystycznymi wynika z różnicy w interpretacji prawdopodobieństwa. Prawdopodobieństwo Bayesa to stwierdzenie o osobistym przekonaniu, że wydarzenie miało (lub miało) miejsce. Częstym prawdopodobieństwem jest stwierdzenie o odsetku podobnych zdarzeń, które występują w limicie wraz ze wzrostem liczby tych zdarzeń.
Dla mnie „myślenie jak bayesianin” oznacza aktualizowanie twojego osobistego przekonania w miarę pojawiania się nowych informacji i „sprawdzanie [lub martwienie się] jak częsty” - oznacza troskę o wykonanie procedur statystycznych zsumowanych w czasie ich stosowania, np. jaki jest zasięg wiarygodnych przedziałów, jaki jest poziom błędu typu I / II itp.
źródło
Statystyki bayesowskie podsumowują przekonania, podczas gdy statystyki częstokrzyskie podsumowują dowody. Bayesianie postrzegają prawdopodobieństwo jako stopień przekonania. Ten obejmujący i generatywny rodzaj rozumowania jest użyteczny przy formułowaniu hipotez. Na przykład Bayesianie mogą być w stanie dowolnie przypisać pewne prawdopodobieństwo, że księżyc jest zrobiony z zielonego sera, niezależnie od tego, czy astronauci rzeczywiście mogli tam podróżować, aby to sprawdzić. Hipotezę tę może poprzeć pomysł, że z daleka księżyc wyglądajak zielony ser. Częstokroć nie mogą w pojedynkę wyobrazić sobie hipotezy, która jest czymś więcej niż tylko szaleńcem, ani też nie mogą powiedzieć, że dowody faworyzują jedną hipotezę nad drugą. Nawet maksymalne prawdopodobieństwo generuje jedynie statystyki, które są „najbardziej zgodne z tym, co zaobserwowano”. Formalnie statystyki bayesowskie pozwalają nam myśleć nieszablonowo i proponować możliwe do obrony pomysły na podstawie danych. Ale jest to ściśle generowana hipoteza w przyrodzie.
Statystyki często wykorzystywane są w celu potwierdzenia hipotez. Gdy eksperyment jest przeprowadzany dobrze, statystyki częstokrzyskie dostarczają „niezależnego obserwatora” lub „empirycznego” kontekstu do ustaleń poprzez unikanie priory. Jest to zgodne z filozofią nauki Karla Poppera. Istotą dowodów nie jest rozpowszechnianie określonego pomysłu. Mnóstwo dowodów jest zgodne z nieprawidłowymi hipotezami. Dowody mogą jedynie fałszować przekonania.
Wpływ priorów jest ogólnie uważany za błąd w rozumowaniu statystycznym. Jak wiecie, możemy znaleźć wiele przyczyn, dla których tak się dzieje. Psychologicznie wiele osób uważa, że nasze uprzedzenia obserwatorów są wynikiem przeważających w naszym mózgu przeświadczeń, które powstrzymują nas przed naprawdę ważeniem tego, co widzimy. „Obserwacja chmur nadziei”, jak wielebna Matka powiedziała w Wydmie. Popper zaostrzył ten pomysł.
Miało to ogromne znaczenie historyczne w niektórych z największych eksperymentów naukowych naszych czasów. Na przykład John Snow skrupulatnie zebrał dowody na epidemię cholery i doszedł do wniosku, że cholera nie jest spowodowana deprywacją moralną, i wskazał, że dowody są wysoce zgodne z zanieczyszczeniem ścieków: zauważ, że nie doszedł do wniosku tym, odkrycia Snow poprzedzały odkrycie bakterii i nie było zrozumienia mechanistycznego ani etiologicznego. Podobny dyskurs znajduje się w Origin of Species. Nie wiedzieliśmy, czy księżyc jest zrobiony z zielonego sera, dopóki astronauci nie wylądowali na powierzchni i nie pobrali próbek. W tym momencie bocznianie bayesowscy przypisali bardzo, bardzo małe prawdopodobieństwo jakiejkolwiek innej możliwości, a internauci w najlepszym wypadku mogą powiedzieć, że próbki są wysoce niespójne z niczym innym, jak pyłem księżycowym.
Podsumowując, statystyki bayesowskie są podatne na generowanie hipotez, a statystyki częste - na potwierdzanie hipotez. Zapewnienie, że dane są gromadzone niezależnie w tych przedsięwzięciach, jest jednym z największych wyzwań, przed którymi stoją współczesni statystycy.
źródło
Plenty of evidence is consistent with incorrect hypotheses
.Według
Cliff AB
komentarza do PO, brzmi to tak, jakby zmierzali w kierunku empirycznej filozofii bayesowskiej. Istnieją trzy główne bayesowskie szkoły myślenia, a empiryczne bayes szacują priory na podstawie danych, często metodami częstokroć. To nie zgadza się dokładnie z cytatem (co implikuje Bayesa z góry, późniejsze obawy podobne do częstych), ale nie powinniśmy przeoczyćCliff AB
doskonałego komentarza.Poza tym istniała i może nadal istniała szkoła bayesowska, która myślała, że nie trzeba niczego sprawdzać po procedurze bayesowskiej. Bardziej nowoczesna myśl wykorzystałaby późniejsze kontrole predykcyjne i być może takie podejście polega na podwójnym sprawdzaniu odpowiedzi.
Również filozofia częstokroć zajmuje się procedurami, a nie wnioskami z danych. Być może jest to również wskazówka na temat znaczenia cytatu.
źródło
W kontekście tej klasy analizy danych moja interpretacja „sprawdzania jak częsty” jest taka, że oceniasz wydajność swojej funkcji predykcji lub funkcji decyzyjnej w odniesieniu do przetrzymywanych danych walidacyjnych. Rada, by „myśleć jak bayesowski” wyraża opinię, że funkcja predykcyjna pochodząca z podejścia bayesowskiego ogólnie daje dobre wyniki.
źródło
To brzmi jak „myśl jak Bayesian, sprawdź jak częsty” odnosi się do własnego podejścia w projektowaniu i analizie statystycznej. Jak rozumiem, myślenie bayesowskie wiąże się z pewnym przekonaniem o wcześniejszych sytuacjach (eksperymentalnie lub statystycznie), powiedzmy na przykład, że średnie wyniki czytania dla uczniów klas czwartych wynoszą 80 słów na minutę, a interwencja może zwiększyć je do 90 słów na minutę . Są to przekonania oparte na wcześniejszych badaniach i hipotezach. Myślenie częsty ekstrapoluje wyniki (interwencji), aby uzyskać przedziały ufności lub inne statystyki oparte na teoretycznej i praktycznej częstotliwości lub prawdopodobieństwie powtórzenia się tych wyników (tj. „Jak często”). Na przykład wynik czytania po interwencji może wynosić 91 słów na minutę z 95% przedziałem ufności wynoszącym 85 do 97 słów na minutę, a powiązana wartość p (wartość prawdopodobieństwa) jest różna od wyniku przed interwencją. Tak więc w 95% przypadków nowe wyniki czytania wyniosą od 85 do 97 słów na minutę po interwencji. Dlatego „myśl jak bayesowski” --- tj. Teoretyzuj, stawiaj hipotezy, spójrz na poprzednie dowody i „sprawdzaj jak częsty” - tj. Jak często pojawiałyby się te wyniki eksperymentów i jak prawdopodobne są one z powodu szansa zamiast interwencji. nowe wyniki czytania wyniosą od 85 do 97 słów na minutę po interwencji. Dlatego „myśl jak bayesowski” --- tj. Teoretyzuj, stawiaj hipotezy, spójrz na poprzednie dowody i „sprawdzaj jak częsty” - tj. Jak często pojawiałyby się te wyniki eksperymentów i jak prawdopodobne są one z powodu szansa zamiast interwencji. nowe wyniki czytania wyniosą od 85 do 97 słów na minutę po interwencji. Dlatego „myśl jak bayesowski” --- tj. Teoretyzuj, stawiaj hipotezy, spójrz na poprzednie dowody i „sprawdzaj jak częsty” - tj. Jak często pojawiałyby się te wyniki eksperymentów i jak prawdopodobne są one z powodu szansa zamiast interwencji.
źródło