Subiektywność w statystyce częstych

Często słyszę twierdzenie, że statystyki bayesowskie mogą być bardzo subiektywne. Głównym argumentem jest to, że wnioskowanie zależy od wyboru przeora (chociaż można użyć zasady obojętności o maksymalnej entropii, aby wybrać przeor). Dla porównania, jak twierdzi twierdzenie, statystyki częstokroć są na ogół bardziej obiektywne. Ile prawdy jest w tym stwierdzeniu?

Ponadto zastanawiam się:

Jakie są konkretne elementy statystyk częstokroć (jeśli takie istnieją), które mogą być szczególnie subiektywne i które nie są obecne lub są mniej ważne w statystykach bayesowskich?
Czy subiektywność jest bardziej rozpowszechniona w statystykach bayesowskich niż w statystyce częstokrzyskiej?

bayesian interpretation frequentist philosophical Amelio Vazquez-Reina
źródło

Z pewnością metody częste są bardziej subiektywne niż reklamowane, ale argumentowałbym, że metody bayesowskie są nadal bardziej subiektywne. I proszę, nie przekonuj się, że niezmienność twojego przeora w grupie lub specyfikacja przełożonego MaxEnt są w jakiś sposób „obiektywne” - oba typy przed potencjalnie wyrażają przekonania, które uważam za pouczające, aw każdym razie żadna strategia nie ma zastosowania w całości (np. nie sądzę, aby w przestrzeni CDFs były niezmienne lub priorytety MaxEnt, a jakikolwiek wcześniejszy w tej przestrzeni przypisuje prawdopodobieństwo 1 do zestawu skąpego topologicznie).

facet

Bayesianie zaczynają od subiektywnej podstawy, a następnie dane (miejmy nadzieję) wciągają ich z powrotem do obiektywnej rzeczywistości. Częstokroć zaczynają (a przynajmniej myślą, że tak) od obiektywnych pozycji, ale potem skazą analizę na swoje subiektywne założenia.

Aksakal

Bayesianie zarówno wiedzą, jak i są z góry przekonani. Częstokroć zazwyczaj nie.

Alexis

Odpowiedzi:

Często słyszę twierdzenie, że statystyki bayesowskie mogą być bardzo subiektywne.

Ja też. Ale zauważcie, że istnieje wielka dwuznaczność w nazywaniu czegoś subiektywnego.

Subiektywność (oba zmysły)

Subiektywny może oznaczać (przynajmniej) jeden z

zależy od specyfiki badacza
wyraźnie zainteresowany stanem wiedzy jednostki

Bayesianizm jest subiektywny w drugim sensie, ponieważ zawsze oferuje sposób na aktualizację przekonań reprezentowanych przez rozkłady prawdopodobieństwa poprzez uzależnienie od informacji. (Zauważ, że to, czy te przekonania są przekonaniami, które faktycznie ma jakiś podmiot, czy tylko przekonania, które podmiot może mieć, nie ma znaczenia przy podejmowaniu decyzji, czy jest ono „subiektywne”).

Głównym argumentem jest to, że wnioskowanie zależy od wyboru przeora

Właściwie, jeśli przed reprezentuje osobiste przekonanie o czymś, wtedy prawie na pewno nie wybrać go na dłużej niż wybrała większość swoich przekonań. A jeśli reprezentuje on czyjeś przekonania, może to być mniej lub bardziej dokładne przedstawienie tych przekonań, więc jak na ironię będzie raczej „obiektywny” fakt, jak dobrze je reprezentuje.

(chociaż można zastosować zasadę obojętności o maksymalnej entropii, aby wybrać przeora).

Można, choć nie uogólnia to bardzo płynnie do domen ciągłych. Prawdopodobnie nie można być płaskim ani „obojętnym” we wszystkich parametryzacjach naraz (chociaż nigdy nie byłem całkiem pewien, dlaczego chcesz być).

Dla porównania, jak twierdzi twierdzenie, statystyki częstokroć są na ogół bardziej obiektywne. Ile prawdy jest w tym stwierdzeniu?

Jak więc możemy ocenić to roszczenie?

Sugeruję, że w drugim drugim sensie subiektywnym: jest to w większości poprawne. I w pierwszym sensie subiektywnym: to prawdopodobnie fałszywe.

Częstotliwość jako subiektywna (drugi zmysł)

Niektóre historyczne szczegóły są pomocne w mapowaniu problemów

W przypadku Neymana i Pearsona istnieje tylko zachowanie indukcyjne, a nie wnioskowanie indukcyjne, a wszystkie oceny statystyczne działają z długoterminowymi właściwościami próbkowania estymatorów. (Stąd analiza alfa i mocy, ale nie wartości p). Jest to dość nieobiektywne w obu aspektach.

Rzeczywiście jest możliwe i wydaje mi się rozsądne argumentowanie zgodnie z tymi założeniami, że Frequentism w rzeczywistości wcale nie jest ramą wnioskowania, ale raczej zbiorem kryteriów oceny dla wszystkich możliwych procedur wnioskowania, które podkreślają ich zachowanie podczas wielokrotnego stosowania. Prostymi przykładami byłyby konsekwencja, bezstronność itp. To sprawia, że jest to oczywiście nieobiektywne w sensie 2. Jednak ryzykuje również subiektywność w sensie 1, gdy musimy zdecydować, co zrobić, gdy te kryteria nie mają zastosowania (np. Gdy nie ma obiektywny szacownik, który należy mieć) lub kiedy mają zastosowanie, ale są sprzeczne.

Fisher zaoferował interesujący mniej subiektywny Częstotliwość. Dla Fishera istnieje coś takiego, jak wnioskowanie indukcyjne, w tym sensie, że badany, naukowiec, dokonuje wnioskowania na podstawie analizy danych przeprowadzonej przez statystykę. (Stąd wartości p, ale nie analiza alfa i mocy). Jednak decyzje o tym, jak się zachować, czy kontynuować badania itp., Podejmowane są przez naukowiec na podstawie jej zrozumienia teorii domen, a nie przez statystycznego stosującego paradygmat wnioskowania. Z powodu tego rybiego podziału pracy zarówno subiektywność (sens 2), jak i podmiot indywidualny (sens 1) leżą po stronie naukowej, a nie statystycznej.

Z prawnego punktu widzenia Częstotliwość Fishera jest subiektywna. Po prostu podmiot subiektywny nie jest statystyką.

Dostępne są różne syntezy, zarówno ledwo spójna mieszanka tych dwóch, które można znaleźć w podręcznikach statystyki użytkowej, jak i bardziej szczegółowe wersje, np. „Statystyka błędów” opracowana przez Deborah Mayo. To ostatnie jest dość nieobiektywne w sensie 2, ale wysoce subiektywne w sensie 1, ponieważ badacz musi zastosować ocenę naukową - styl Fishera - aby ustalić, jakie prawdopodobieństwa błędu mają znaczenie i które należy przetestować.

Częstotliwość jako subiektywna (pierwszy zmysł)

Czy więc częstotliwość jest mniej subiektywna w pierwszym sensie? To zależy. Każda procedura wnioskowania może być pomieszana z osobliwościami, jakie są faktycznie stosowane. Być może bardziej przydatne jest pytanie, czy Frequentism zachęca do mniej subiektywnego (pierwszego zmysłu) podejścia? Wątpię - myślę, że samoświadome stosowanie metod subiektywnych (drugiego zmysłu) prowadzi do mniej subiektywnych (pierwszego zmysłu) wyników, ale można to argumentować w obu przypadkach.

Załóżmy przez chwilę, że subiektywność (pierwszy zmysł) zakrada się do analizy poprzez „wybory”. Bayesianizm wydaje się obejmować więcej „wyborów”. W najprostszym przypadku wybory są zbieżne jako: jeden zestaw potencjalnie idiosynkratycznych założeń dla Frequentist (funkcja Prawdopodobieństwo lub równoważny) i dwa zestawy dla Bayesian (Prawdopodobieństwo i pierwszeństwo przed nieznanymi).

Jednak Bayesianie wiedzą, że są subiektywni (w drugim sensie) w odniesieniu do wszystkich tych wyborów, więc mogą być bardziej świadomi konsekwencji, które powinny prowadzić do mniejszej subiektywności (w pierwszym tego słowa znaczeniu).

W przeciwieństwie do tego, jeśli ktoś spojrzy na test w dużej książce testów, wówczas można odnieść wrażenie, że wynik jest mniej subiektywny (pierwszy zmysł), ale zapewne wynika to z zastąpienia rozumienia problemu przez inny podmiot własnym. . Nie jest jasne, że ktoś stał się mniej subiektywny w ten sposób, ale może się tak wydawać. Myślę, że większość zgodzi się, że to nie jest pomocne.

sprzężonyprior
źródło

Słownikowa definicja „subiektywnego” (prosto z Google) mówi: oparta na osobistych uczuciach, gustach lub opiniach lub pod ich wpływem. np. „jego poglądy są wysoce subiektywnymi” synonimami: osobisty, spersonalizowany, indywidualny, wewnętrzny, emocjonalny, instynktowny, intuicyjny, impresjonistyczny . Zauważ, że odzwierciedla to teorię ludową, że „pogląd” (tj. Przekonanie) jest subiektywny (sens 1: impresjonistyczny, intuicyjny, dziwny itp.), Ponieważ dotyczy wewnętrznego stanu określonego podmiotu (sens 2: spersonalizowany, indywidualny itp. .) zamiast być publicznym, tj . bezosobowym .

conjugateprior

Pomocne może być rozważenie psychologii poznawczej jako przykładu. To pole jest całkowicie subiektywne (w drugim znaczeniu, bo to wszystko o wewnętrznych stanach ludzi i ich wpływu na zachowanie tych ludzi), ale to nie subiektywne w pierwszym znaczeniu, ponieważ psychologowie nie mogą właściwie tylko usiąść i zrobić rzeczy się na podstawa ich własnego stanu wewnętrznego.

conjugateprior

Odwrotna skrajność, w której coś jest całkowicie osobliwe i subiektywne (sens 1), ale w rzeczywistości nie dotyczy przedmiotów, jest trudniejsza do znalezienia. Być może Lukrecjusz wyjaśniający atomy i pustkę w de Rerum Naturae jest przykładem.

conjugateprior

Dokładnie. Angielski jest dość nieprzydatny w tej kwestii ...

sprzężony przed

i zatwierdziłem (i nieznacznie dostosowałem) proponowaną zmianę

sprzężony przed

Subiektywizm w podejściu częstokroć jest powszechny w zastosowaniu wnioskowania. Podczas testowania hipotezy ustalasz poziom ufności, powiedzmy 95% lub 99%. Skąd to pochodzi? Nie pochodzi nigdzie indziej niż z twoich własnych preferencji lub dominującej praktyki w twojej dziedzinie.

Sprawa bayesowska bardzo mało na dużych zestawach danych, ponieważ kiedy zaktualizujesz ją o dane, rozkład późniejszy zniknie z twojego wcześniejszego, ponieważ coraz więcej danych jest przetwarzanych.

Powiedziawszy, że Bayesianie zaczynają od subiektywnej definicji prawdopodobieństwa, przekonań itp. To odróżnia ich od częstych, którzy myślą w kategoriach obiektywnych prawdopodobieństw. W małych zestawach danych robi to różnicę

AKTUALIZACJA: Mam nadzieję, że nienawidzisz filozofii tak samo jak ja, ale od czasu do czasu mają ciekawe myśli, rozważ subiektywizm . Skąd mam wiedzieć, że naprawdę jestem na SE? Co jeśli to moje marzenie? itp. :)

Aksakal
źródło

Oprócz wyboru poziomu ufności w testowaniu hipotez (ponieważ to samo można argumentować w statystyce bayesowskiej, na przykład przy wyborze kryteriów porównania HDP / HDI z LINĄ do odrzucenia lub zaakceptowania hipotezy ), czy subiektywność odgrywa rolę w uzyskiwanie oceny punktowej lub uzyskiwanie przedziałów ufności, być może przy wyborze estymatorów?

Amelio Vazquez-Reina

Rozumiem również, że poziomy istotności są ustalane w statystyce częstościowej w kontekście podejmowania decyzji (tj. Czy powinniśmy odrzucić hipotezę zerową?), A nie w obliczaniu prawdopodobieństw. W Bayesowskiej teorii decyzji to samo można argumentować o wyborze funkcji straty, która może wpłynąć na optymalną (wybraną) decyzję. Co więcej, wartości poziomu ufności są zwykle wybierane z akceptowalnego poziomu błędu typu I (np. 95% w NHST jest ustalane bezpośrednio na podstawie „fałszywie dodatniego wskaźnika nie wyższego niż 5%”)

Amelio Vazquez-Reina

Z pewnością wcześniejsze analizy mają duże znaczenie przy analizie dużych zbiorów danych w przypadku najbardziej interesujących współczesnych problemów. To prawda, że mamy asymptotyczne wyniki, kiedy

n \to \infty

$n \to \infty$ i

p ≪ n

$p \ll n$ , ale zazwyczaj ludzie z dużymi zbiorami danych zadają duże pytania, więc w pewnym sensie

p \to \infty

$p \to \infty$ w tempie porównywalnym do

n

$n$ , a tutaj odpowiedni przeor będzie działał jak regulator i będzie miał duże znaczenie.

facet

Warto zauważyć, że funkcje strat mogą nie być subiektywne (tj. Całkowicie zdeterminowane przez kontekst), w którym to przypadku optymalne decyzje bayesowskie mogą być całkowicie obiektywne niezależnie od wcześniejszych.

@Mathew Tak, chociaż dotyczy to również wyboru

α

$\alpha$ w NHST od maksymalnego dopuszczalnego wskaźnika fałszywie dodatnich, jak wspomniałem powyżej.

Amelio Vazquez-Reina