Jeśli 900 na 1000 osób twierdzi, że samochód jest niebieski, jakie jest prawdopodobieństwo, że jest niebieski?

114

To początkowo powstało w związku z pracą, jaką wykonujemy na modelu, aby sklasyfikować tekst naturalny, ale uprościłem go ... Być może za dużo.

Masz niebieski samochód (według obiektywnej miary naukowej - jest niebieski).

Pokazujesz to 1000 osobom.

900 twierdzi, że jest niebieski. 100 nie.

Przekazujesz te informacje komuś, kto nie widzi samochodu. Wiedzą tylko, że 900 osób twierdziło, że było niebieskie, a 100 nie. Nic nie wiesz o tych ludziach (1000).

Na tej podstawie pytasz osobę: „Jakie jest prawdopodobieństwo, że samochód jest niebieski?”

Spowodowało to ogromną rozbieżność opinii wśród osób, o które prosiłem! Jaka jest prawidłowa odpowiedź, jeśli istnieje?

Pat Molloy
źródło
162
Zastanawiam się, jakie byłyby odpowiedzi, gdybyś zmienił samochód na strój .
user1717828,
13
Więc jakie jest pytanie do ludzi? „Czy samochód jest niebieski?” lub „Jakiego koloru jest samochód?”
kon psych
13
Co to znaczy, że samochód jest niebieski? Jeśli niektórzy twierdzą, że samochód nie jest niebieski, to jest prawdopodobne, że jest to kolor, który niektórzy nazywają niebieskim, a inni pod inną nazwą. Nie oznacza to, że nie zgadzają się co do koloru, co oznacza, że ​​nie zgadzają się co do nazwy koloru.
Ben
7
Myślę, że pytanie znacznie by się poprawiło, gdybyś przedstawił różne rozbieżne opinie, które napotkałeś. W obecnej sytuacji odpowiedzi mogą po prostu zgłębić całą dziedzinę, od teorii prawdopodobieństwa po teorię kolorów, a nawet biologię (ślepota barw), i nie wiem, jak to by ci naprawdę pomogło.
AnoE,
32
W opisie problemu brakuje czegoś. 100 osób zaprzeczających, że samochód jest niebieski, a na pewno niebieski to wiele osób, nie można po prostu odrzucić ich jako przypadkowych błędów.
Aksakal

Odpowiedzi:

117

TL; DR: Jeśli nie przypuszczasz, że ludzie są nieuzasadnie źle oceniając kolor samochodu lub że niebieskie samochody są nieuzasadnione rzadko, duża liczba osób w twoim przykładzie oznacza prawdopodobieństwo, że samochód jest niebieski, wynosi w zasadzie 100%.

Matthew Drury już udzielił prawidłowej odpowiedzi, ale chciałbym dodać do tego kilka przykładów liczbowych, ponieważ wybraliście swoje liczby tak, aby uzyskać całkiem podobne odpowiedzi dla szerokiego zakresu różnych ustawień parametrów. Załóżmy na przykład, jak powiedzieliśmy w jednym ze swoich komentarzy, że prawdopodobieństwo, że ludzie prawidłowo ocenią kolor samochodu, wynosi 0,9. To znaczy: a także p ( powiedzmy, że nie jest niebieski | samochód nie jest niebieski ) = 0,9 = 1 - p ( powiedz, że jest niebieski | samochód nie jest niebieski )

p(say it's blue|car is blue)=0.9=1p(say it isn't blue|car is blue)
p(say it isn't blue|car isn't blue)=0.9=1p(say it is blue|car isn't blue)

Po zdefiniowaniu tego pozostaje nam jeszcze jedna decyzja: jakie jest wcześniejsze prawdopodobieństwo, że samochód jest niebieski? Wybierzmy bardzo małe prawdopodobieństwo, aby zobaczyć, co się stanie, i powiedzmy, że , tj. Tylko 0,1% wszystkich samochodów ma kolor niebieski. Następnie prawdopodobieństwo tylne, że samochód jest niebieski, można obliczyć jako:p(car is blue)=0.001

p(car is blue|answers)=p(answers|car is blue)p(car is blue)p(answers|car is blue)p(car is blue)+p(answers|car isn't blue)p(car isn't blue)=0.9900×0.1100×0.0010.9900×0.1100×0.001+0.1900×0.9100×0.999

Jeśli spojrzymy na mianownik, jasne jest, że drugi wyraz w tej sumie będzie nieistotny, ponieważ względna wielkość wyrazów w sumie jest zdominowana przez stosunek do , co jest rzędu . I rzeczywiście, jeśli wykonasz te obliczenia na komputerze (uważając, aby uniknąć problemów z niedopełnieniem numerycznym), otrzymasz odpowiedź równą 1 (z dokładnością do maszyny). 0,1 900 10 580.99000.19001058

Powody, dla których wcześniejsze prawdopodobieństwa tak naprawdę nie mają tutaj większego znaczenia, to fakt, że masz tyle dowodów na jedną możliwość (samochód jest niebieski) w porównaniu z drugą. Można to określić ilościowo za pomocą współczynnika wiarygodności , który możemy obliczyć jako:

p(answers|car is blue)p(answers|car isn't blue)=0.9900×0.11000.1900×0.910010763

Tak więc, zanim jeszcze weźmiemy pod uwagę wcześniejsze prawdopodobieństwa, dowody sugerują, że jedna opcja jest już astronomicznie bardziej prawdopodobna niż druga, a zanim coś zmieni, niebieskie samochody musiałyby być nierozsądnie, głupio rzadkie (tak rzadkie, że spodziewalibyśmy się znajdź 0 niebieskich samochodów na ziemi).

A co jeśli zmienimy, jak dokładni ludzie opisują kolor samochodu? Oczywiście moglibyśmy doprowadzić to do skrajności i powiedzieć, że robią to dobrze tylko w 50% przypadków, co nie jest lepsze niż rzut monetą. W tym przypadku prawdopodobieństwo tylne, że samochód jest niebieski, jest po prostu równe prawdopodobieństwu wcześniejszemu, ponieważ odpowiedzi ludzi nic nam nie mówiły. Ale z pewnością ludzie robią co najmniej trochę lepiej, a nawet jeśli mówimy, że ludzie są dokładni tylko w 51% przypadków, współczynnik prawdopodobieństwa nadal działa, tak że jest to około razy większe prawdopodobieństwo dla samochodu być niebieskim.1013

Wszystko to wynika z dość dużych liczb, które wybrałeś w przykładzie. Gdyby 9/10 osób twierdziło, że samochód jest niebieski, byłaby to zupełnie inna historia, mimo że ten sam stosunek ludzi był w jednym obozie w porównaniu do drugiego. Ponieważ dowody statystyczne nie zależą od tego stosunku, ale raczej od numerycznej różnicy między przeciwnymi frakcjami. W rzeczywistości, w stosunku prawdopodobieństwa (który kwantyfikuje dowody), 100 osób, które mówią, że samochód nie jest niebieski, dokładnie anuluje 100 z 900 osób, które twierdzą, że jest niebieski, więc jest tak, jakby wszyscy zgodzili się na 800 osób było niebieskie. I to oczywiście dość wyraźne dowody.

(Edycja: Jak zauważył Silverfish , założenia, które tu poczyniłem, faktycznie sugerują, że ilekroć ktoś nieprawidłowo opisuje nie niebieski samochód, domyślnie powie, że jest niebieski. Nie jest to oczywiście realistyczne, ponieważ mogliby naprawdę powiedzieć dowolny kolor i przez pewien czas będą mówić o kolorze niebieskim. Nie ma to jednak znaczenia dla wniosków, ponieważ im mniej prawdopodobne jest, że ludzie pomylą niebieski samochód z niebieskim, tym silniejsze dowody, że jest niebieski, kiedy to mówią. jeśli więc cokolwiek, liczby podane powyżej są w rzeczywistości tylko dolną granicą pro-niebieskich dowodów).

Ruben van Bergen
źródło
11
+1. W rzeczywistości, biorąc pod uwagę dane OP, oszacowanie MLE dotyczące częstotliwości dokładności ludzi wynosi 900/1000 = 90%.
ameba
5
Poprawienie koloru samochodu w 50% przypadków to nie to samo, co rzut monetą. W końcu istnieją znacznie więcej niż dwa dostępne kolory. A może niektórzy mówią „granatowy” lub „lazurowy” zamiast „niebieski”? W rzeczywistości ludzie Mayn błędnie powiedzą „niebieski”, gdy poprawną odpowiedzią będzie „jakiś fantazyjny i modny opatentowany kolor, który prawie wygląda jak niebieski”
Hagen von Eitzen,
10
Wiem, że to tylko ilustrujące liczby, ale jeśli „prawdopodobieństwo, że ludzie prawidłowo ocenią kolor samochodu, wynosi 0,9”, to chyba że jest coś wyjątkowego w kolorze niebieskim, nie sądzę, aby uzasadnione było twierdzenie o p (powiedzmy to niebieski | samochód nie jest niebieski) = 0.1. Jeśli uważamy, że w 90% przypadków ludzie identyfikują prawidłowy kolor, to p (powiedzmy, że czerwony | samochód jest czerwony) = p (powiedzmy, że biały | samochód jest biały) = p (powiedzmy zielony | samochód jest zielony) = 0,9 i tak włączony dla wszystkich możliwych kolorów samochodu. Ale dlaczego p (powiedzmy, że niebieski | samochód jest czerwony) = p (powiedzmy, że niebieski | samochód jest biały) = p (powiedzmy, że niebieski | samochód jest zielony) = 0,1? Oznaczałoby to np. P (powiedzmy, że biały | samochód jest czerwony) = 0.
Silverfish,
2
@PatMolloy: Niekoniecznie. Zależy to od tego, czy prawdopodobieństwo jest symetryczne: czy równie prawdopodobne jest, że ktoś pomyli kolor niebieski w przypadku samochodu innego niż niebieski, ponieważ jest tak, że ktoś pomyli kolor niebieski w przypadku samochodu niebieski? Jeśli tak, to werdykt 500/500 daje dokładnie tyle samo informacji, co rzut monetą. Ale jeśli ludzie rzadziej twierdzą, że niebieski samochód nie jest niebieski, to twierdzą, że niebieski samochód nie jest niebieski, to 500 niebieskich mówców jest trudniejszych do wyjaśnienia niż 500 niebieskich mówców pod hipoteza niebieska. W takim przypadku bilans dowodów przechyliłby się na niebieski.
Ruben van Bergen
3
Percepcja kolorów jest trudna… jeśli dziewięć na dziesięć osób twierdzi, że sukienka jest biała i złota, jakie jest prawdopodobieństwo, że jest niebiesko-czarna?
Glen_b
73

Prawidłowa odpowiedź zależy od informacji nieokreślonych w problemie, konieczne będzie przyjęcie kilku założeń, aby uzyskać jedną, ostateczną odpowiedź:

  • Wcześniejsze prawdopodobieństwo, że samochód jest niebieski, tzn. Twoje przekonanie, że samochód jest niebieski, biorąc pod uwagę, że jeszcze nikogo nie pytałeś.
  • Prawdopodobieństwo, że ktoś powie ci, że samochód jest niebieski, kiedy faktycznie jest niebieski, i prawdopodobieństwo, że powie ci, że samochód jest niebieski, kiedy tak naprawdę nie jest niebieski.
  • Prawdopodobieństwo, że samochód rzeczywiście jest niebieski, gdy ktoś mówi, że jest, i prawdopodobieństwo, że samochód nie jest niebieski, gdy ktoś mówi, że jest niebieski.

1000

Ppost(car is blue)=P(car is bluesay is blue)P(say is blue)    +P(car is bluesay is not blue)P(say is not blue)

P(say is blue)

P(say is blue)= P(say is bluecar is blue)Pprior(car is blue)+P(say is bluecar is not blue)Pprior(car is not blue)

Więc dwa zastosowania reguły Bayesa cię tam zaprowadzą. Musisz określić nieokreślone parametry na podstawie posiadanych informacji o konkretnej sytuacji lub na podstawie pewnych uzasadnionych założeń.

Istnieje kilka innych kombinacji możliwych założeń, opartych na:

P(say is bluecar is blue)P(car is blue)=P(car is bluesay is blue)P(say is blue)

Na początku nie znasz żadnej z tych rzeczy. Musisz więc przyjąć rozsądne założenia dotyczące trzech z nich, a następnie określa się czwarty z nich.

Matthew Drury
źródło
5
Tak często jest. Następnie masz dwie opcje, wyrażając swój całkowity brak wiedzy, zakładając, że niebieski i nie niebieski są jednakowo prawdopodobne. Dokonaj szybkiej ankiety w terenie, coś takiego może pomóc: en.wikipedia.org/wiki/Car_colour_popularity
Matthew Drury
18
@ Mateusz Problem z „niebieskim, a nie niebieskim jest równie prawdopodobne” polega na tym, że nie jest spójny; jeśli zastosujemy to samo rozumowanie do każdego z możliwych kolorów samochodu, otrzymamy twierdzenie, że wszystkie one jednocześnie mają 50% szansy (niemożliwe z więcej niż dwoma kolorami według praw prawdopodobieństwa) i mniej niż 50% szansy (kiedy spójrz na niebieski w „nie biały” i „nie czerwony”, co również prowadzi do sprzeczności, ponieważ prawdopodobieństwo dowolnego koloru nie może przyjąć wielu wartości)
Glen_b
2
Jest więcej nieokreślonych informacji niż to, ponieważ odpowiedzi ludzi nie muszą być niezależne (mamy nadzieję , że są one silnie skorelowane z kolorem obiektywnym, a więc dalekim od niezależnego). Co jeśli odpowiedzi są „nadmiernie” zależne? Powiedzmy, że po prostu pytamy dziesięciu przypadkowych pieszych, ale czy każdy z nich odpowiada 100 razy?
Hagen von Eitzen,
2
P(Joe and Mary say blue|car is blue)=P(Joe says blue|car is blue)P(Mary says blue|car is blue)
15
@Glen_b: Na świecie są tylko dwa kolory: niebieski i nie niebieski. Wprawdzie oba są w różnych odcieniach, zwłaszcza nie niebieskich.
psmears
13

Istnieje ważne założenie, że twoje 1000 opinii nie podziela systematycznego nastawienia. Co jest tutaj rozsądnym założeniem, ale może być ważne w innych przypadkach.

Przykładami mogą być:

  • wszyscy mają podobną ślepotę barw (na przykład genetyka w populacji),
  • wszyscy widzieli samochód w nocy przy pomarańczowym oświetleniu ulicznym sodu,
  • wszystkie mają wspólną kulturę, w której niebieski jest tabu lub magicznie z nim związany (co wpływa na to, czy opisują jakikolwiek przedmiot jako niebieski, czy też używają eufemizmu kulturowego lub cokolwiek innego),
  • wszyscy zostali poinformowani (lub podzielają wspólne przekonanie), że jeśli odpowiedzą / nie odpowiedzą w określony sposób, przydarzy się im coś dobrego / złego .....

W tym przypadku nie jest prawdopodobne, ale w innych przypadkach jest to znaczące dorozumiane założenie. Nie musi to być aż tak ekstremalne - przełóż swoje pytanie na inną domenę, a to będzie prawdziwy czynnik.

Przykłady dla każdego, w którym na twoją odpowiedź może wpływać wspólne uprzedzenie:

  • zapytaj, czy wysoka, cienka szklanka mieści więcej niż faktycznie identyczne szkło o krótkim tłuszczu, ale 1000 respondentów to bardzo małe dzieci (wspólne błędne postrzeganie).
  • zapytaj 1000 osób, czy chodzenie pod drabiną jest niebezpieczne (powszechne przekonanie kulturowe)
  • zapytaj 1000 osób pozostających w związku małżeńskim, czy kochają swojego partnera / mają romans, w okolicznościach, w których, jak sądzą, ich partner dowie się o ich odpowiedzi. Kontekstem może być program telewizyjny lub partner obecny na zapytanie itp. (Powszechne przekonanie o konsekwencjach)

Nietrudno wyobrazić sobie jakieś strukturalnie identyczne pytania, w których odpowiedź 900: 100 była miarą przekonań i uczciwości lub czymś innym i nie wskazuje na poprawną odpowiedź. W tym przypadku mało prawdopodobne, ale w innych przypadkach - tak.

Stilez
źródło
11

Jednym z powodów, dla których otrzymujesz różne odpowiedzi od różnych osób, jest to, że pytanie można interpretować na różne sposoby i nie jest jasne, co rozumiesz przez „prawdopodobieństwo”. Jednym ze sposobów na zrozumienie pytania jest przypisanie priorów i rozumu za pomocą reguły Bayesa, jak w odpowiedzi Matthew.

Zanim zapytasz o prawdopodobieństwo, musisz zdecydować, co jest modelowane losowo, a co nie. Nie jest powszechnie akceptowane, że nieznane, ale stałe ilości powinny być przypisane priory. Oto podobny eksperyment do twojego, który uwypukla problem z pytaniem:

Xii=1,,1000p=0.5Xii=11000Xi=900

pp

ekvall
źródło
1
Jeśli więc usuniesz założenie, że samochód jest niebieski, a reszta jest taka sama, 900 osób twierdzi, że jest niebieski, a 100 twierdzi, że nie, w takim przypadku prawdopodobieństwo wyniesie 0,9?
użytkownik
Nie, jest znacznie bliżej do 1. Jest bardzo, bardzo mało prawdopodobne, aby 900 na 1000 osób pomyliło kolor.
gnasher729,
1
the probability is either one or zero, depending on whether the car is actually blue or not.nie odpowiada to zrozumieniu „prawdopodobieństwa”, jakie znam. Brzmi to trochę tak: „X może się zdarzyć lub nie może się zdarzyć, więc prawdopodobieństwo musi wynosić 50%”. Czy możesz wyjaśnić, co masz na myśli przez to zdanie?
AnoE
2
@AnoE rozróżnienie jest analogiczne do rozróżnienia między parametrami a zmiennymi losowymi. Jest podane w ustawieniu pytania, że ​​samochód jest faktem niebieskim, jego kolor nie jest wynikiem losowego eksperymentu. Zasadniczo jest to interpretator częsty przeciwko interpretacji bayesowskiej. Jeśli rzucisz monetą 1000 razy i zaobserwujesz 900 głów, to jakie jest prawdopodobieństwo, że moneta jest uczciwa? Jest to jeden lub zero, jeśli jesteś częstym (lub nonsensownym); nie przypisujemy prawdopodobieństw do parametrów.
ekvall
@ użytkownik Nie, zaktualizowałem odpowiedź, aby wyjaśnić mój punkt widzenia.
ekvall
7

Prosta praktyczna odpowiedź:

Prawdopodobieństwo może wynosić od 0% do 100% w zależności od twoich założeń

Chociaż naprawdę podoba mi się istniejące odpowiedzi, w praktyce sprowadza się do dwóch prostych scenariuszy:

Scenariusz 1: Zakłada się, że ludzie są bardzo dobrzy w rozpoznawaniu niebieskiego, gdy jest niebieski ... 0%

W tym przypadku jest tak wiele osób twierdzących, że samochód nie jest niebieski, że jest bardzo mało prawdopodobne, aby samochód był niebieski. Stąd prawdopodobieństwo zbliża się do 0%.

Scenariusz 2: Zakłada się, że ludzie bardzo dobrze rozpoznają kolor niebieski, gdy nie jest niebieski ... 100%

W tym przypadku jest tak wiele osób, które twierdzą, że samochód jest niebieski, że jest bardzo prawdopodobne, że rzeczywiście jest niebieski. Stąd prawdopodobieństwo zbliża się do 100%.


Oczywiście, patrząc na to z matematycznego punktu widzenia, zacząłbyś od czegoś ogólnego, takiego jak „załóżmy, że odpowiednie prawdopodobieństwa są…”, co jest zupełnie bez znaczenia, ponieważ takie rzeczy zwykle nie są znane z żadnych przypadkowych okoliczności. Dlatego opowiadam się za przyjrzeniem się skrajnościom, aby zrozumieć ideę, że oba odsetki można łatwo uzasadnić prostymi i realistycznymi założeniami, i że w związku z tym nie ma jednej konkretnej odpowiedzi.

Dennis Jaheruddin
źródło
2
Jeśli „zakłada się, że ludzie są bardzo dobrzy w rozpoznawaniu niebieskiego”, dlaczego mieliby oceniać, że jest niebieski, skoro nie ma go w scenariuszu 1? Możesz wyrazić swoje scenariusze w kategoriach fałszywych pozytywów i fałszywych negatywów.
hyde
@hyde Zmienił kolejność scenariuszy, aby usunąć niejednoznaczność
Dennis Jaheruddin
5

Musisz opracować ramy szacowania. Oto niektóre pytania, które możesz zadać

  1. Ile jest kolorów? Czy mówimy w dwóch kolorach? Czy wszystkie kolory tęczy?

  2. Jak wyraziste są kolory? Czy mówimy niebieski i pomarańczowy? Lub niebieski, turkusowy i turkusowy?

  3. Co to znaczy być niebieskim? Czy niebieskozielony i / lub turkusowy? A może po prostu sam niebieski?

  4. Jak dobrze ci ludzie oceniają kolor? Czy wszyscy są projektantami graficznymi? A może są ślepi na kolory?

Z czysto statystycznego punktu widzenia możemy zgadywać co do ostatniego. Po pierwsze wiemy, że co najmniej 10% osób wybiera niewłaściwą odpowiedź. Jeśli są tylko dwa kolory (od pierwszego pytania), możemy powiedzieć, że są

Probability says blue and is blue = 90% say is blue * 90% correct = 81%
Probability says blue and is not = 90% * 10% incorrect = 9%
Probability says not but is blue = 10% * 90% incorrect = 9%
Probability says not and is not = 10% * 10% = 1%

W ramach szybkiego sprawdzenia, jeśli dodamy je razem, otrzymamy 100%. Bardziej matematyczny zapis tego można zobaczyć w odpowiedzi na @MatthewDrury .

Jak uzyskać 90% w trzecim? Tyle osób mówiło na niebiesko, ale się myliło, jeśli nie. Ponieważ są tylko dwa kolory, są one symetryczne. Gdyby istniały więcej niż dwa kolory, wówczas szansa na zły wybór byłaby niebieska, gdy powiedzieliby, że coś innego będzie niższe.

W każdym razie ta metoda szacowania daje nam 90% niebieskiego. Obejmuje to 81% szans, że ludzie mówią niebieski, gdy jest, i 9% szans, że ludzie mówią, że nie jest, kiedy jest. Jest to prawdopodobnie najbliższa odpowiedź na pierwotne pytanie i wymaga od nas polegania na danych w celu oszacowania dwóch różnych rzeczy. I założyć, że szansa na wybranie niebieskiego jest taka sama, jak szansa na poprawność niebieskiego.

Jeśli są więcej niż dwa kolory, logika trochę się zmieni. Pierwsze dwie linie pozostają takie same, ale tracimy symetrię w dwóch ostatnich liniach. W takim przypadku potrzebujemy więcej danych. Prawdopodobnie możemy ponownie oszacować szansę poprawnego powiedzenia niebieskiego na 81%, ale nie mamy pojęcia, jakie są szanse, że kolor będzie niebieski, gdy ktoś powie, że tak nie jest.

Moglibyśmy również poprawić nawet szacowanie dwóch kolorów. Biorąc pod uwagę statystycznie znaczącą liczbę samochodów każdego koloru, możemy mieć statystycznie znaczącą liczbę osób, która je wyświetli i skategoryzuje. Następnie moglibyśmy policzyć, jak często ludzie mają rację, kiedy dokonują każdego wyboru koloru i jak często mają rację przy każdym wyborze koloru. Wtedy moglibyśmy dokładniej oszacować rzeczywiste wybory ludzi.

Możesz zapytać, w jaki sposób 90% może się mylić. Zastanów się, co się stanie, jeśli będą trzy kolory: lazurowy, niebieski i szafirowy. Ktoś mógłby rozsądnie uznać wszystkie trzy z nich za niebieskie. Ale chcemy więcej. Chcemy dokładnego odcienia. Ale kto pamięta nazwy innych odcieni? Wielu może zgadywać niebieski, ponieważ jest to jedyny pasujący odcień, jaki znają. I nadal się myl, kiedy okazuje się lazur.

Brythan
źródło
Jak wspomniano w jednym z wcześniejszych komentarzy, z pewnością jedynymi dwoma istotnymi kolorami są „niebieski” i „nie niebieski”, dlatego część dotycząca wielu kolorów nie powinna być potrzebna.
Dennis Jaheruddin
4

Dokładny, matematyczny, prawda / fałsz prawdopodobieństwo nie może być obliczona z informacji, które udostępniasz.

Jednak w rzeczywistości takie informacje nigdy nie są dostępne z pewnością. Dlatego korzystając z naszej intuicji (i dokąd trafiłyby wszystkie moje pieniądze, gdybyśmy obstawiali), samochód jest zdecydowanie niebieski. (niektórzy uważają, że to już nie statystyki, ale czarno-białe poglądy na naukę nie są zbyt pomocne)

Rozumowanie jest proste. Załóżmy, że samochód nie jest niebieski. 90% osób (!) Się myliło. Mogą się mylić tylko z powodu listy problemów, w tym:

Ponieważ powyższe nie ma wyraźnego wpływu na 90% przeciętnej populacji losowej (np. Ślepota na kolory dotyka około 8% mężczyzn i 0,6% kobiet, czyli 43 osoby na 1000), koniecznie jest tak, że samochód jest niebieski. (To znaczy, gdyby wszystkie moje pieniądze i tak by poszły).

Luchonacho
źródło
To intuicyjnie wydaje mi się właściwe. Myślę, że krytyka pierwotnego pytania polega na tym, że nie zawiera wystarczających informacji i że należy poczynić pewne założenia ... no cóż, czy w rzeczywistości nie zawsze tak jest w rzeczywistości ???
Pat Molloy,
@PatMolloy Nie zawiera wystarczającej ilości informacji, aby podać dokładną właściwą / złą wyrafinowaną matematyczną odpowiedź (co z pewnością jest celem wielu pytań z tej strony). Jednak biorąc pod uwagę ograniczone informacje, które podałeś, jeśli chodzi o obstawianie pieniędzy, jest to odpowiedź (100%) ludzie wybiorą.
luchonacho
1
Myślę, że nie udało ci się przedstawić niektórych z najbardziej prawdopodobnych alternatyw - które powinny zmusić cię do zmiany wniosku. Należą do nich (a) ludzie nie są w stanie rozpoznać niebieskiego; (b) nie ma powszechnego zrozumienia „niebieskiego” między pytającym a respondentami; (c) „naukowe” znaczenie „niebieskiego” różni się od tego, co ludzie powszechnie rozumieją jako „niebieskiego”. Co ważne, ponieważ nie można obliczyć żadnej z tych alternatyw, ani większości z wymienionych na liście, w jaki sposób można uzasadnić kwantyfikację prawdopodobieństwa odpowiedzi? To nie statystyki!
whuber
„Ponieważ powyższe najwyraźniej nie wpłynie na 90% przeciętnej populacji losowej” Nie bądź tego pewien. Pamiętaj, że ogólnie rozmawiamy o ludziach w kategoriach średnich. Tak więc na pewno tylko kilka procent ma ślepotę barw (w porównaniu do średniej), ale może być wyraźnych kilka osób, które mają lepsze widzenie, np. Tetrachromat.
NPSF3000,
2
Zawsze jestem pod wpływem LCD
Alex,
2

Nie zjadłbym kału, ponieważ miliardy much nie mogą się mylić. Może być wiele innych powodów, dla których 900 osób na 1000 mogło zostać oszukanych na myśl, że samochód jest niebieski. W końcu to podstawa magicznych sztuczek, które skłaniają ludzi do myślenia, że ​​coś zostało usunięte z rzeczywistości. Jeśli 900 osób na 1000 zobaczy, jak mag dźgnął swojego asystenta, natychmiast odpowie, że asystent został dźgnięty nożem, ponieważ to nieprawdopodobne, że miało miejsce zabójstwo na scenie. Niebieskie światło na odblaskowej farbie samochodowej, ktoś?

użytkownik174494
źródło
2

Ankietowany wie za mało o tym, jak przeprowadzono ankietę, aby odpowiedzieć na pytanie dokładnie. Według niego w ankiecie może wystąpić kilka problemów:

Osoby biorące udział w ankiecie mogły być stronnicze:

  1. Samochód wyglądał na niebieski z powodu iluzji optycznej .

  2. Kolor samochodu był z jakiegoś powodu trudny do zaobserwowania, a ludziom z jakiegoś powodu pokazano wiele niebieskich samochodów przed tym, co sprawia, że ​​większość z nich uważa, że ​​ten samochód też prawdopodobnie był niebieski.

  3. Zapłaciłeś im, żeby powiedzieć, że samochód jest niebieski.

  4. Ktoś zahipnotyzował ich wszystkich, aby uwierzyli, że samochód jest niebieski.

  5. Zawarli pakt o kłamstwie i sabotowaniu ankiety.

Osoby biorące udział w ankiecie mogły mieć związek z tym, jak zostali wybrani lub ze względu na wzajemny wpływ:

  1. Przypadkowo przeprowadziłeś ankietę na spotkaniu masowym dla osób z tym samym rodzajem ślepoty na kolory.

  2. Ankietę przeprowadziłeś w przedszkolach; dziewczynki nie były zainteresowane samochodem, a większość chłopców miała niebieski kolor jako ulubiony kolor, przez co wyobrażali sobie, że samochód jest niebieski.

  3. Pierwsza osoba, której pokazano samochód, była pijana i pomyślała, że ​​ma niebieski kolor, krzyknęła „TO JEST NIEBIESKA”, co sprawiło, że wszyscy myśleli, że samochód jest niebieski.

Tak więc, chociaż prawdopodobieństwo, że samochód jest niebieski, jeśli ankieta została całkowicie poprawnie przeprowadzona, jest bardzo wysokie (jak wyjaśniono w odpowiedzi Ruben van Bergen), wiarygodność ankiety mogła zostać zagrożona, co sprawia, że ​​samochód nie jest niebieski nieistotny. To, jak duża osoba oceniająca oceni tę szansę, zależy ostatecznie od jego oceny, jak prawdopodobne jest, że okoliczności popsuły się ankietą oraz od tego, jak dobry jesteś w przeprowadzaniu ankiet (i jak złośliwy on myśli, że jesteś).

Cześć Żegnaj
źródło
2

Jaka jest definicja „niebieskiego”?

Różne kultury i języki mają różne pojęcia niebieskiego. IIRC, niektóre kultury obejmują zieleń w ich pojęciu niebieskiego!

Jak każde słowo w języku naturalnym, można jedynie założyć, że istnieje konwencja kulturowa określająca, kiedy (a kiedy nie) nazywać rzeczy „niebieskim”.

Ogólnie rzecz biorąc, kolor w języku jest zaskakująco subiektywny (link z poniższych komentarzy, dzięki @Count Ibilis)

wprowadź opis zdjęcia tutaj

Anony-Mus
źródło
7
W kontekście pytania uważam, że ten konkretny aspekt jest dość nieistotny - zakładam, że OP wybrał słowo „niebieski” jako bardzo ogólny termin, a nie coś w rodzaju „lazur”, „torqouise” itp., W którym ludzie mogą być niepewni. Ponadto samochody zwykle używają bardzo ograniczonej palety możliwych / zwykłych kolorów. W końcu pytanie nie brzmi „dlaczego 100 osób powiedziało, że nie jest niebieski”, ale „jakie jest prawdopodobieństwo, że samochód jest niebieski”.
AnoE
2
vimeo.com/120808489
Hrabia Iblis
Dokładna definicja brzmiałaby: „promieniuje światłem głównie o długości fali 475 nm plus minus ~ 10-20 nm w obecnych warunkach otoczenia”. Jest to ogólnie akceptowane jako niebieskie.
rackandboneman
Tak, ale ile osób nosi przy sobie narzędzie do pomiaru dominującej długości fali? Zapomniałeś również wykluczyć niewidoczne długości fal.
Anony-Mousse,
1
Pytanie wydaje się dotyczyć użycia grupy osób o nieznanej kalibracji statystycznej jako miernika długości fali :)
rackandboneman
1

Prawdopodobieństwo, w zależności od bardziej wyrafinowanych warunków wstępnych, może wynosić kilka różnych wartości, ale 99,995% jest dla mnie najbardziej sensowne.

Wiemy z definicji, że samochód jest niebieski (to 100%), ale nie jest dokładnie określone, co to właściwie oznacza (to byłoby trochę filozoficzne). Zakładam, że coś jest niebieskie w tym sensie, że można je zobaczyć jako niebieskie.

Wiemy również, że 90% badanych osób zgłosiło to jako niebieskie.

Mamy nie wiedzieć co pytano czy jak ocena została wykonana, a co oświetlenie warunki samochód był w. Być poprosi o podanie nazwy koloru, niektórzy pacjenci mogą na przykład powiedzieć „zielono-niebieski” ze względu na warunki oświetlenia, a oceniający może nie liczyłem tego jako „niebieskiego”. Ci sami ludzie mogliby odpowiedzieć „tak”, gdyby pytanie brzmiało „Czy to jest niebieskie?”. Zakładam, że nie zamierzałeś oszukiwać swoich poddanych testowi.

Wiemy, że częstość występowania tritanopy wynosi około 0,005%, co oznacza, że ​​gdyby samochód można było rzeczywiście uznać za niebieski , wówczas 99,995% badanych rzeczywiście widziało kolor niebieski. Oznacza to jednak, że 9,995% badanych nie zgłosiło koloru niebieskiego, gdy wyraźnie zobaczyło kolor niebieski. Kłamali o tym, co zobaczyli. Jest to bliskie temu, co mówi ci również twoje doświadczenie życiowe: ludzie nie zawsze są szczerzy (ale, o ile nie ma motywu, zwykle są).

Zatem osoba niepostrzegająca może z ogromną pewnością założyć, że samochód jest niebieski. To byłoby 100%

Z wyjątkiem ... z wyjątkiem sytuacji, gdy osoba niepostrzegająca sama cierpi na tritanopy, w którym to przypadku nie widziałaby samochodu jako niebieskiego, mimo że wszyscy inni (a raczej 90% z nich) tak mówi. Tutaj znów zaczyna się filozofować: jeśli wszyscy słyszeli, jak pada drzewo, a ja nie, to czy pada?

Śmiem twierdzić, że najbardziej sensowną i praktyczną odpowiedzią byłoby: jeśli osoba nieobserwująca okazuje się być trianopą (szansa 0,005%), to sprawdzenie, czy przewidywany kolor i rzeczywisty kolor są takie same, dałoby fałsz. Zatem prawdopodobieństwo wynosi 99,995%, a nie 100%.

Co więcej, jako bonus, odkąd dowiedzieliśmy się, że 9,995% badanych to kłamcy, i wiadomo, że wszyscy Kreteńczycy są kłamcami , możemy stwierdzić, że nie jesteśmy na Krecie!

Damon
źródło
1

Masz niebieski samochód (według obiektywnej miary naukowej - jest niebieski).

...

„Jakie jest prawdopodobieństwo, że samochód jest niebieski?”

Jest w 100% niebieski.

Wiedzą tylko, że 900 osób twierdziło, że było niebieskie, a 100 nie. Nic nie wiesz o tych ludziach (1000).

Używanie tych liczb (bez żadnego kontekstu) jest całkowicie nonsensowne. Wszystko sprowadza się do osobistej interpretacji pytania. Nie powinniśmy podążać tą ścieżką i użyć Wittgensteina: „Wovon man nicht sprechen kann, darüber muss man schweigen”.


Wyobraź sobie następujące pytanie do porównania:

All they know is that 0 people said it was blue, and 0 did not. 
You know nothing more about these people (the 0).

Jest to zasadniczo ten sam problem (mniej informacji), ale o wiele bardziej jasne jest, że to, co myślimy o kolorze samochodu, jest w większości (jeśli nie całkowicie) poszlakowe.


Na dłuższą metę, kiedy otrzymamy wiele powiązanych pytań, możemy zacząć zgadywać odpowiedzi na takie niekompletne pytania. To samo dotyczy algorytmu tit-for-tat, który nie działa w pojedynczym przypadku, ale działa na dłuższą metę . W tym samym sensie Wittgenstein powrócił ze swojej wcześniejszej pracy z głównymi badaniami . Jesteśmy w stanie odpowiedzieć na te pytania, ale potrzebujemy więcej informacji / prób / pytań. To jest proces.

Martijn Weterings
źródło
0

Jeśli założymy, że samochód jest niebieski, to 100 na 1000, mówiąc, że nie jest niebieski, oznacza ekstremalne odchylenie próbki. Być może próbowałeś tylko ludzi ślepych na kolory. Jeśli założymy, że samochód nie jest niebieski, to odchylenie próbki jest jeszcze gorsze. Na podstawie podanych danych możemy jedynie wyciągnąć wniosek, że próbka jest bardzo stronnicza, a ponieważ nie wiemy, jak była stronnicza, nie możemy wyciągnąć żadnych wniosków na temat koloru samochodu.

Mike Scott
źródło
Umm, z pewnością fakt, że 900 osób powiedziało, że jest niebieski, jest na coś przydatny? Czy nie możemy stwierdzić, że jest bardziej niebieski niż nie? Pamiętaj, że respondent zna tylko liczby 900 i 100. Więc czy naprawdę mogą powiedzieć coś o uprzedzeniach?
Pat Molloy,
0

Było kilka odpowiedzi. W żadnym wypadku nie jestem guru matematyki, ale cóż, oto moja.

Mogą istnieć tylko 4 możliwości:

case 1) Persons says car is blue and is correct
case 2) Person says car is blue and is incorrect
case 3) Person says car is not blue and is correct
case 4) Person says car is not blue and is incorrect

Z pytania wiadomo, że suma przypadku 1 i przypadku 4 wynosi 900 osób (90%), a suma przypadku 2 i przypadku 3 wynosi 100 osób (10%). Ale tutaj jest haczyk: to, czego nie wiesz, to rozkład w tych dwóch parach przypadków. Może suma przypadków 1 i 4 całkowicie składa się z przypadku 1 (co oznacza, że ​​samochód jest niebieski), a może cała suma składa się z przypadku 4 (co oznacza, że ​​samochód nie jest niebieski). To samo dotyczy sumy przypadku 2 + 3. Więc ... Musisz wymyślić jakiś sposób, aby przewidzieć rozkład w sumach przypadków. Bez żadnego innego wskazania w pytaniu (nigdzie nie jest powiedziane, że ludzie są w 80% pewni, że znają swoje kolory itp.), Nie ma sposobu, aby uzyskać określoną, jednoznaczną odpowiedź.

Powiedziawszy to ... Podejrzewam, że oczekiwana odpowiedź jest następująca:

P(Blue) = (case 1 + case 4) * 900 / 1000 = (1/4  + 1/4) * 900 / 1000 = 45 %
P(non-Blue) = (case 2 + case  3) * 100 / 1000 = (1/4 + 1/4) * 100 / 1000 = 5%

gdzie pozostałe 50% jest po prostu nieznane, nazwij to marginesem błędu.

Tuncay Göncüoğlu
źródło
0

X,Y1,Y2,,Y1000{0,1}1p(x)pxYi|X=1p1Yi|X=0p0θ=(px,p0,p1)

p(θ,x|y1:1000)p(θ)p(x|θ)i=11000p(yi|x)

{xi}{yi|x}

Taylor
źródło
-3

Osoba, która nie widzi samochodu, nie wie, że jest naukowo udowodniony, że jest niebieski. Prawdopodobieństwo, że samochód jest niebieski, wynosi 50/50 (jest niebieski lub nie jest). Sondowanie innych osób może wpłynąć na opinię tej osoby, ale nie zmienia to prawdopodobieństwa, że ​​niewidziany samochód będzie niebieski albo nie.

Wszystkie powyższe obliczenia określają prawdopodobieństwo, że zestaw próbek może ustalić, czy jest niebieski.

chleb kukurydziany
źródło
Nie jestem pewien, czy to prawda, że ​​prawdopodobieństwo, że jest niebieski, wynosi 50/50. W rzeczywistości jest to mniej niż 50, ponieważ może to być czerwony, biały, żółty itp. Prawdopodobieństwo, że losowo wybrany samochód jest niebieski, wynosi znacznie mniej niż 50%.
użytkownik