Trzy otwarte problemy filozoficzne w statystyce

9

Niedawno skończyłem czytać The Lady Tasting Tea , zabawną książkę o historii statystyki. Na końcu książki autor David Salsburg proponuje trzy otwarte problemy filozoficzne w statystyce, a rozwiązania, które jego zdaniem miałyby większe implikacje dla zastosowania teorii statystycznej w nauce. Nigdy wcześniej nie słyszałem o tych problemach, dlatego interesują mnie reakcje innych ludzi. Zapuszczam się na terytorium, o którym mam niewielką wiedzę, więc opiszę Salsburg przedstawianie tych problemów i postawię poniżej dwa ogólne pytania dotyczące tych problemów.

Problemy filozoficzne Salsburga to:

  1. Czy do podejmowania decyzji można wykorzystać modele statystyczne?
  2. Jakie znaczenie ma prawdopodobieństwo w odniesieniu do prawdziwego życia?
  3. Czy ludzie naprawdę rozumieją prawdopodobieństwo?

Statystyki i podejmowanie decyzji

Jako ilustrację problemu przedstawionego w pytaniu 1 Salsburg przedstawia następujący paradoks. Załóżmy, że organizujemy loterię z 10000 nienumerowanymi losami. Jeśli wykorzystamy prawdopodobieństwo, aby podjąć decyzję, czy dany bilet wygra na loterii, odrzucając tę ​​hipotezę dla biletów z prawdopodobieństwami poniżej, powiedzmy 0,001, odrzucimy hipotezę o zwycięskim losie dla wszystkich biletów w loterii!

Salsburg używa tego przykładu, aby argumentować, że logika jest niespójna z teorią prawdopodobieństwa, ponieważ teoria prawdopodobieństwa jest obecnie rozumiana, i dlatego nie mamy obecnie dobrych środków na zintegrowanie statystyki (która w nowoczesnej formie opiera się w dużej mierze na teoria prawdopodobieństwa) z logicznym sposobem podejmowania decyzji.

Znaczenie prawdopodobieństwa

Jako matematyczna abstrakcja Salsburg twierdzi, że prawdopodobieństwo działa dobrze, ale kiedy próbujemy zastosować wyniki w prawdziwym życiu, napotykamy na problem, że prawdopodobieństwo nie ma konkretnego znaczenia w prawdziwym życiu. Mówiąc dokładniej, kiedy mówimy, że jutro istnieje 95% szans na deszcz, nie jest jasne, do jakich podmiotów ma zastosowanie 95%. Czy dotyczy to zestawu możliwych eksperymentów, które moglibyśmy przeprowadzić, aby uzyskać wiedzę na temat deszczu? Czy dotyczy to osób, które mogą wyjść na zewnątrz i zmoknąć? Salsburg twierdzi, że brak środków do interpretowania prawdopodobieństw stwarza problemy dla każdego modelu statystycznego opartego na prawdopodobieństwie (tj. Większości z nich).

Czy ludzie rozumieją prawdopodobieństwo?

Salsburg twierdzi, że jedną próbą rozwiązania problemów z brakiem konkretnych sposobów interpretacji prawdopodobieństwa jest koncepcja „ osobistego prawdopodobieństwa ” zaproponowana przez Jimmie Savage i Bruno de Finetti, która rozumie prawdopodobieństwo jako osobiste przekonanie o prawdopodobieństwie przyszłych wydarzeń. Jednak aby osobiste prawdopodobieństwo mogło zapewnić spójną podstawę prawdopodobieństwa, ludzie muszą mieć wspólne zrozumienie tego, co to jest prawdopodobieństwo, oraz wspólne środki wykorzystania dowodów w celu wyciągnięcia wniosków na temat prawdopodobieństwa. Niestety, dowody takie jak te przedstawione przez Kahnemana i Tversky'ego sugerują, że osobiste przekonania mogą być trudną podstawą do stworzenia spójnej podstawy prawdopodobieństwa. Salsburg sugeruje, że metody statystyczne, które modelują prawdopodobieństwa jako przekonania (być może takie jak metody bayesowskie? Rozciągam tutaj swoją wiedzę), będą musiały poradzić sobie z tym problemem.

Moje pytania

  1. W jakim stopniu problemy Salsburga są tak naprawdę problemami współczesnej statystyki?
  2. Czy osiągnęliśmy jakiś postęp w poszukiwaniu rozwiązań tych problemów?
Patrick S. Forscher
źródło
1
+1 Rozbudowaną dyskusję na temat (1) i (3) - z jednoznacznymi odpowiedziami empirycznymi - znajdziesz w książce Daniela Kahnemanna Myślenie, szybko i wolno (2011).
whuber
2
Musiałbym ponownie przeczytać książkę, ale (1) wydaje się dość dziwnym wykorzystaniem prawdopodobieństwa przy podejmowaniu decyzji. Nie musisz odrzucać hipotez, aby podejmować decyzje, podejmowanie decyzji, która maksymalizuje oczekiwany zwrot, jest całkowicie uzasadnione, a w tym przypadku powiedziałbyś, że każdy los na loterii jest równie dobry jak każdy inny (z wyłączeniem uwzględnienia zachowania innych klientów ).
Dikran Marsupial
3
Muszę powiedzieć, że miałem trudności z odczytaniem pierwszego „paradoksu”; autorowi, który wypowiada się na temat statystyki i procesu decyzyjnego, wydaje się, że nie mając wiedzy na temat statystycznego procesu decyzyjnego, nie można ufać ogólnemu stosowaniu statystyk. Ponadto, jak pokazali Russell i Whitehead, logika jest częścią matematyki, i oczywiście tak samo jest z teorią prawdopodobieństwa, więc nie mogą być ze sobą niespójni - chyba że sama matematyka jest wewnętrznie niespójna. Jeśli chodzi o paradoks # 2, zapytaj dowolnego aktuariusza lub hazardzistę, czy prawdopodobieństwo można zastosować w prawdziwym życiu.
jbowman
„kiedy mówimy, że jutro istnieje 95% szans na deszcz, nie jest jasne, które podmioty stosuje 95%”. Gigerenzer (np. w „Ryzykownym doświadczeniu”) omawia to, ale w całkowicie praktyczny i nie filozoficzny sposób. Sugeruje, że przynajmniej przeliterujesz 95% tego, co (w przypadku prognoz pogody: zwykle dni są podobne do jutra), lub lepiej: że na 19 z 20 takich dni padał deszcz i podasz definicję tego, co oznacza „deszcz” konkretnie. Twierdzi również, że dzieci w wieku szkolnym mogą zrozumieć takie stwierdzenia, ale mało kto może, jeśli pominięto istotne informacje na temat mianownika.
cbeleites niezadowoleni z SX

Odpowiedzi:

4

Czy możemy wykorzystywać statystyki / prawdopodobieństwo do podejmowania decyzji? Oczywiście możemy, sposobem, w jaki powinniśmy to zrobić, jest wybór sposobu działania, który minimalizuje naszą oczekiwaną stratę. W takim przypadku prawdopodobnie pojawią się wszystkie numery loterii; jeśli wszyscy zapewnią tę samą nagrodę, to oczekiwana strata jest taka sama dla dowolnej liczby, więc nie ma znaczenia, którą wybierzemy. Jeśli mamy również opcję, aby nie grać w loterię, prawdopodobnie byłby to sposób działania, który zminimalizuje nasze spodziewane straty, zakładając, że loteria przynosi zysk komuś (lub przynajmniej pokrywa koszty prowadzenia loterii ). Oczywiście jest to po prostu zdrowy rozsądek i jest zgodne z logiką i może być wyrażone w kategoriach czysto probabilistycznych.

Wydaje mi się, że pytanie wynika z dość ograniczonego spojrzenia na to, jak statystyki mogą być wykorzystywane do podejmowania decyzji, nie musi to być zrobione za pomocą quasi-rybackich testów hipotez.

Sugerowałbym, że książka Jaynesa na temat teorii prawdopodobieństwa jest dobrym sposobem na odniesienie się do punktów (2) i (3), prawdopodobieństwa mogą reprezentować obiektywne miary prawdopodobieństwa, nie będąc „osobistymi prawdopodobieństwami”, ale spodziewam się, że @probabilityislogic może to wyjaśnić lepiej niż ja mogą.

Dikran Torbacz
źródło
4

Nie sądzę, że to naprawdę pytania, na które można jednoznacznie odpowiedzieć. (IOW, oni są rzeczywiście filozoficzni). To mówi...

Statystyki i podejmowanie decyzji

Tak, możemy wykorzystywać statystyki w podejmowaniu decyzji.

Istnieją jednak ograniczenia dotyczące jego zastosowania; IOW, trzeba zrozumieć, co się robi.

Odnosi się to w pełni do każdej teorii.

Znaczenie prawdopodobieństwa

95% prawdopodobieństwo deszcz Jutro oznacza, że jeśli Twój koszt przygotowania do deszczu (np biorąc parasol) to Ai twój koszt przyłapania w deszczu nieprzygotowany (np kombinezonie) jest B, to należy wziąć parasol z wami iff A < 0.95 * B .

Czy ludzie rozumieją prawdopodobieństwo?

Nie, ludzie nie rozumieją wiele, a już najmniej prawdopodobieństwa.

Kahneman i Tversky wykazali, że ludzka intuicja jest wadliwa na wielu poziomach, ale intuicja i zrozumienie nie są identyczne, i argumentowałbym, że ludzie rozumieją nawet mniej niż intuicyjnie.

W jakim stopniu problemy Salsburga są tak naprawdę problemami współczesnej statystyki?

Zero. Nie sądzę, aby ktokolwiek troszczył się o te kwestie, z wyjątkiem filozofów i tych w filozoficznym nastroju.

Czy osiągnęliśmy jakiś postęp w poszukiwaniu rozwiązań tych problemów?

Każdy, kogo to obchodzi, ma rozdzielczość. Moja osobista rozdzielczość jest powyżej.

sds
źródło