Czy Bayesianie kiedykolwiek twierdzą, że ich podejście uogólnia podejście częstokroć częstokroć, ponieważ można zastosować nieinformacyjne priory i dlatego można odzyskać typową strukturę modelu częstokroć?
Czy ktoś może skierować mnie do miejsca, w którym mogę przeczytać o tym argumencie, jeśli rzeczywiście jest on używany?
EDYCJA: To pytanie może być sformułowane niezupełnie tak, jak chciałem je sformułować. Pytanie brzmi: „czy jest jakieś odniesienie do dyskusji na temat przypadków, w których podejście bayesowskie i podejście częstokroć nakładają się / przecinają / mają coś wspólnego poprzez zastosowanie pewnego uprzedniego?” Jednym z przykładów byłoby użycie niewłaściwego wcześniejszego , ale jestem prawie pewien, że jest to tylko wierzchołek góry lodowej.
źródło
Odpowiedzi:
Widziałem dwa wysunięte argumenty, że analiza bayesowska jest uogólnieniem analizy częstokrzyskiej. Oba były nieco zuchwałe i bardziej zachęcały ludzi do rozpoznania założeń dotyczących modeli regresji, używając priorytetów jako kontekstu.
Argument 1: Częstotliwościowa analiza to analiza Bayesa z czysto nieinformacyjnym uprzednim środkiem na zero (tak, nie ma znaczenia, gdzie jest wyśrodkowana, ale to zignoruj). Zapewnia to zarówno kontekst, dla którego Bayesian może wyodrębnić wyniki analizy częstokrzyskiej, wyjaśnia, dlaczego można uciec się do korzystania z niektórych technik „bayesowskich”, takich jak MCMC, w celu wyodrębnienia szacunków częstych w sytuacjach, w których, powiedzmy, maksymalna zbieżność prawdopodobieństwa jest trudna i dostaje ludzie rozpoznają, że kiedy mówią „Dane mówią same za siebie” i tym podobne, to, co tak naprawdę mówią, to że wcześniej wszystkie wartości są jednakowo prawdopodobne.
Argument 2: Każdy termin regresji, którego nie uwzględniono w modelu, został w rzeczywistości przypisany wcześniejszemu środkowi zera bez wariancji. Ten nie jest tak bardzo argumentem „analiza bayesowska jest uogólnieniem”, jak „argumentem wszędzie są priory , nawet w modelach częstych”.
źródło
Krótka odpowiedź brzmi prawdopodobnie „tak - i nie potrzebujesz nawet wcześniejszego uprzedzenia, aby ten argument się utrzymał”.
Na przykład, oszacowanie Maximum A Posteriori (MAP) jest uogólnieniem maksymalnego prawdopodobieństwa, które obejmuje uprzednie, i istnieją częste podejścia, które są analitycznie równoważne ze znalezieniem tej wartości. Częstochowiec nazywa „przejęcie” jako „ograniczenie” lub „karę” funkcji wiarygodności i otrzymuje tę samą odpowiedź. Tak więc zarówno częsterzy, jak i bayesianie mogą wskazywać na to samo, co jest ich najlepszym oszacowaniem parametrów, nawet jeśli filozofie są różne. Sekcja 5 tego artykułu dla osób często podróżujących to jeden przykład, w którym są one równoważne.
Dłuższa odpowiedź jest bardziej podobna do „tak, ale często istnieją inne aspekty analizy, które rozróżniają te dwa podejścia. Mimo to, nawet te rozróżnienia niekoniecznie są odziane w żelazo w wielu przypadkach”.
Na przykład, podczas gdy Bayesianie czasami używają oszacowania MAP (tryb boczny), gdy jest to wygodne, zwykle zamiast tego podkreślają średnią tylną. Z drugiej strony, środek tylny ma również częstokształtny analog, zwany „zapakowanym” oszacowaniem (z „agregacji bootstrapu”), który może być prawie nie do odróżnienia (patrz ten plik pdf, aby zobaczyć przykład tego argumentu). Więc to nie jest tak naprawdę „trudne” rozróżnienie.
W praktyce wszystko to oznacza, że nawet jeśli częsty człowiek robi coś, co Bayesian uznałby za całkowicie nielegalne (lub odwrotnie), często (przynajmniej w zasadzie) istnieje podejście z innego obozu, które dałoby prawie taki sam anser.
Głównym wyjątkiem jest to, że niektóre modele są naprawdę trudne do dopasowania z perspektywy częstych, ale jest to bardziej kwestia praktyczna niż filozoficzna.
źródło
Edwin Jaynes był jednym z najlepszych w podkreślaniu związków między wnioskowaniem bayesowskim a częstym. Jego papierowe przedziały ufności kontra przedziały bayesowskie (Google go przywołuje) jako bardzo dokładne porównanie - i myślę, że jest uczciwy.
Oszacowanie małego obszaru to kolejny obszar, w którym odpowiedzi ML / REML / EB / HB wydają się być bliskie.
źródło
Wiele z tych komentarzy zakłada, że „częsty” oznacza „oszacowanie maksymalnego prawdopodobieństwa”. Niektóre osoby mają inną definicję: „częsty” oznacza rodzaj analizy długoterminowych właściwości wnioskowania dowolnej metody wnioskowania - bez względu na to, czy jest to metoda bayesowska, metoda chwilowa, maksymalne prawdopodobieństwo, czy też coś nieprobabilistycznego warunki (np. SVM) itp.
źródło
Chciałbym usłyszeć o tym od Stephane'a lub innego eksperta z Bayesian. Powiedziałbym „nie”, ponieważ jest to inne podejście, a nie uogólnienie. W innym kontekście zostało to już tutaj omówione. Nie myśl, że tylko dlatego, że płaskie priory dają wyniki zbliżone do maksymalnego prawdopodobieństwa, że metoda bayesowska z płaskim przeorem jest częsta! Sądzę, że byłoby to fałszywe domniemanie, które doprowadziłoby cię do myślenia, że dokonując uprzedniego arbitrażu, uogólniasz na inne możliwe priorytety. Nie sądzę w ten sposób i jestem pewien, że większość Bayesian też tego nie robi.
Więc niektórzy ludzie się z tym kłócą, ale nie sądzę, że powinni być klasyfikowani jako Bayesianie
chociaż Stephane wskazał na trudności z silną klasyfikacją. Tak ściśle mówiąc, jeśli słowo jest kiedykolwiek, to myślę, że może zależeć od tego, jak zdefiniujesz Bayesian.
źródło