To początkowo powstało w związku z pracą, jaką wykonujemy na modelu, aby sklasyfikować tekst naturalny, ale uprościłem go ... Być może za dużo.
Masz niebieski samochód (według obiektywnej miary naukowej - jest niebieski).
Pokazujesz to 1000 osobom.
900 twierdzi, że jest niebieski. 100 nie.
Przekazujesz te informacje komuś, kto nie widzi samochodu. Wiedzą tylko, że 900 osób twierdziło, że było niebieskie, a 100 nie. Nic nie wiesz o tych ludziach (1000).
Na tej podstawie pytasz osobę: „Jakie jest prawdopodobieństwo, że samochód jest niebieski?”
Spowodowało to ogromną rozbieżność opinii wśród osób, o które prosiłem! Jaka jest prawidłowa odpowiedź, jeśli istnieje?
probability
Pat Molloy
źródło
źródło
Odpowiedzi:
TL; DR: Jeśli nie przypuszczasz, że ludzie są nieuzasadnie źle oceniając kolor samochodu lub że niebieskie samochody są nieuzasadnione rzadko, duża liczba osób w twoim przykładzie oznacza prawdopodobieństwo, że samochód jest niebieski, wynosi w zasadzie 100%.
Matthew Drury już udzielił prawidłowej odpowiedzi, ale chciałbym dodać do tego kilka przykładów liczbowych, ponieważ wybraliście swoje liczby tak, aby uzyskać całkiem podobne odpowiedzi dla szerokiego zakresu różnych ustawień parametrów. Załóżmy na przykład, jak powiedzieliśmy w jednym ze swoich komentarzy, że prawdopodobieństwo, że ludzie prawidłowo ocenią kolor samochodu, wynosi 0,9. To znaczy: a także p ( powiedzmy, że nie jest niebieski | samochód nie jest niebieski ) = 0,9 = 1 - p ( powiedz, że jest niebieski | samochód nie jest niebieski )
Po zdefiniowaniu tego pozostaje nam jeszcze jedna decyzja: jakie jest wcześniejsze prawdopodobieństwo, że samochód jest niebieski? Wybierzmy bardzo małe prawdopodobieństwo, aby zobaczyć, co się stanie, i powiedzmy, że , tj. Tylko 0,1% wszystkich samochodów ma kolor niebieski. Następnie prawdopodobieństwo tylne, że samochód jest niebieski, można obliczyć jako:p ( samochód jest niebieski ) = 0,001
Jeśli spojrzymy na mianownik, jasne jest, że drugi wyraz w tej sumie będzie nieistotny, ponieważ względna wielkość wyrazów w sumie jest zdominowana przez stosunek do , co jest rzędu . I rzeczywiście, jeśli wykonasz te obliczenia na komputerze (uważając, aby uniknąć problemów z niedopełnieniem numerycznym), otrzymasz odpowiedź równą 1 (z dokładnością do maszyny). 0,1 900 10 580,9900 0,1900 1058
Powody, dla których wcześniejsze prawdopodobieństwa tak naprawdę nie mają tutaj większego znaczenia, to fakt, że masz tyle dowodów na jedną możliwość (samochód jest niebieski) w porównaniu z drugą. Można to określić ilościowo za pomocą współczynnika wiarygodności , który możemy obliczyć jako:
Tak więc, zanim jeszcze weźmiemy pod uwagę wcześniejsze prawdopodobieństwa, dowody sugerują, że jedna opcja jest już astronomicznie bardziej prawdopodobna niż druga, a zanim coś zmieni, niebieskie samochody musiałyby być nierozsądnie, głupio rzadkie (tak rzadkie, że spodziewalibyśmy się znajdź 0 niebieskich samochodów na ziemi).
A co jeśli zmienimy, jak dokładni ludzie opisują kolor samochodu? Oczywiście moglibyśmy doprowadzić to do skrajności i powiedzieć, że robią to dobrze tylko w 50% przypadków, co nie jest lepsze niż rzut monetą. W tym przypadku prawdopodobieństwo tylne, że samochód jest niebieski, jest po prostu równe prawdopodobieństwu wcześniejszemu, ponieważ odpowiedzi ludzi nic nam nie mówiły. Ale z pewnością ludzie robią co najmniej trochę lepiej, a nawet jeśli mówimy, że ludzie są dokładni tylko w 51% przypadków, współczynnik prawdopodobieństwa nadal działa, tak że jest to około razy większe prawdopodobieństwo dla samochodu być niebieskim.1013
Wszystko to wynika z dość dużych liczb, które wybrałeś w przykładzie. Gdyby 9/10 osób twierdziło, że samochód jest niebieski, byłaby to zupełnie inna historia, mimo że ten sam stosunek ludzi był w jednym obozie w porównaniu do drugiego. Ponieważ dowody statystyczne nie zależą od tego stosunku, ale raczej od numerycznej różnicy między przeciwnymi frakcjami. W rzeczywistości, w stosunku prawdopodobieństwa (który kwantyfikuje dowody), 100 osób, które mówią, że samochód nie jest niebieski, dokładnie anuluje 100 z 900 osób, które twierdzą, że jest niebieski, więc jest tak, jakby wszyscy zgodzili się na 800 osób było niebieskie. I to oczywiście dość wyraźne dowody.
(Edycja: Jak zauważył Silverfish , założenia, które tu poczyniłem, faktycznie sugerują, że ilekroć ktoś nieprawidłowo opisuje nie niebieski samochód, domyślnie powie, że jest niebieski. Nie jest to oczywiście realistyczne, ponieważ mogliby naprawdę powiedzieć dowolny kolor i przez pewien czas będą mówić o kolorze niebieskim. Nie ma to jednak znaczenia dla wniosków, ponieważ im mniej prawdopodobne jest, że ludzie pomylą niebieski samochód z niebieskim, tym silniejsze dowody, że jest niebieski, kiedy to mówią. jeśli więc cokolwiek, liczby podane powyżej są w rzeczywistości tylko dolną granicą pro-niebieskich dowodów).
źródło
Prawidłowa odpowiedź zależy od informacji nieokreślonych w problemie, konieczne będzie przyjęcie kilku założeń, aby uzyskać jedną, ostateczną odpowiedź:
Więc dwa zastosowania reguły Bayesa cię tam zaprowadzą. Musisz określić nieokreślone parametry na podstawie posiadanych informacji o konkretnej sytuacji lub na podstawie pewnych uzasadnionych założeń.
Istnieje kilka innych kombinacji możliwych założeń, opartych na:
Na początku nie znasz żadnej z tych rzeczy. Musisz więc przyjąć rozsądne założenia dotyczące trzech z nich, a następnie określa się czwarty z nich.
źródło
Istnieje ważne założenie, że twoje 1000 opinii nie podziela systematycznego nastawienia. Co jest tutaj rozsądnym założeniem, ale może być ważne w innych przypadkach.
Przykładami mogą być:
W tym przypadku nie jest prawdopodobne, ale w innych przypadkach jest to znaczące dorozumiane założenie. Nie musi to być aż tak ekstremalne - przełóż swoje pytanie na inną domenę, a to będzie prawdziwy czynnik.
Przykłady dla każdego, w którym na twoją odpowiedź może wpływać wspólne uprzedzenie:
Nietrudno wyobrazić sobie jakieś strukturalnie identyczne pytania, w których odpowiedź 900: 100 była miarą przekonań i uczciwości lub czymś innym i nie wskazuje na poprawną odpowiedź. W tym przypadku mało prawdopodobne, ale w innych przypadkach - tak.
źródło
Jednym z powodów, dla których otrzymujesz różne odpowiedzi od różnych osób, jest to, że pytanie można interpretować na różne sposoby i nie jest jasne, co rozumiesz przez „prawdopodobieństwo”. Jednym ze sposobów na zrozumienie pytania jest przypisanie priorów i rozumu za pomocą reguły Bayesa, jak w odpowiedzi Matthew.
Zanim zapytasz o prawdopodobieństwo, musisz zdecydować, co jest modelowane losowo, a co nie. Nie jest powszechnie akceptowane, że nieznane, ale stałe ilości powinny być przypisane priory. Oto podobny eksperyment do twojego, który uwypukla problem z pytaniem:
źródło
the probability is either one or zero, depending on whether the car is actually blue or not.
nie odpowiada to zrozumieniu „prawdopodobieństwa”, jakie znam. Brzmi to trochę tak: „X może się zdarzyć lub nie może się zdarzyć, więc prawdopodobieństwo musi wynosić 50%”. Czy możesz wyjaśnić, co masz na myśli przez to zdanie?Prosta praktyczna odpowiedź:
Prawdopodobieństwo może wynosić od 0% do 100% w zależności od twoich założeń
Chociaż naprawdę podoba mi się istniejące odpowiedzi, w praktyce sprowadza się do dwóch prostych scenariuszy:
Scenariusz 1: Zakłada się, że ludzie są bardzo dobrzy w rozpoznawaniu niebieskiego, gdy jest niebieski ... 0%
W tym przypadku jest tak wiele osób twierdzących, że samochód nie jest niebieski, że jest bardzo mało prawdopodobne, aby samochód był niebieski. Stąd prawdopodobieństwo zbliża się do 0%.
Scenariusz 2: Zakłada się, że ludzie bardzo dobrze rozpoznają kolor niebieski, gdy nie jest niebieski ... 100%
W tym przypadku jest tak wiele osób, które twierdzą, że samochód jest niebieski, że jest bardzo prawdopodobne, że rzeczywiście jest niebieski. Stąd prawdopodobieństwo zbliża się do 100%.
Oczywiście, patrząc na to z matematycznego punktu widzenia, zacząłbyś od czegoś ogólnego, takiego jak „załóżmy, że odpowiednie prawdopodobieństwa są…”, co jest zupełnie bez znaczenia, ponieważ takie rzeczy zwykle nie są znane z żadnych przypadkowych okoliczności. Dlatego opowiadam się za przyjrzeniem się skrajnościom, aby zrozumieć ideę, że oba odsetki można łatwo uzasadnić prostymi i realistycznymi założeniami, i że w związku z tym nie ma jednej konkretnej odpowiedzi.
źródło
Musisz opracować ramy szacowania. Oto niektóre pytania, które możesz zadać
Ile jest kolorów? Czy mówimy w dwóch kolorach? Czy wszystkie kolory tęczy?
Jak wyraziste są kolory? Czy mówimy niebieski i pomarańczowy? Lub niebieski, turkusowy i turkusowy?
Co to znaczy być niebieskim? Czy niebieskozielony i / lub turkusowy? A może po prostu sam niebieski?
Jak dobrze ci ludzie oceniają kolor? Czy wszyscy są projektantami graficznymi? A może są ślepi na kolory?
Z czysto statystycznego punktu widzenia możemy zgadywać co do ostatniego. Po pierwsze wiemy, że co najmniej 10% osób wybiera niewłaściwą odpowiedź. Jeśli są tylko dwa kolory (od pierwszego pytania), możemy powiedzieć, że są
W ramach szybkiego sprawdzenia, jeśli dodamy je razem, otrzymamy 100%. Bardziej matematyczny zapis tego można zobaczyć w odpowiedzi na @MatthewDrury .
Jak uzyskać 90% w trzecim? Tyle osób mówiło na niebiesko, ale się myliło, jeśli nie. Ponieważ są tylko dwa kolory, są one symetryczne. Gdyby istniały więcej niż dwa kolory, wówczas szansa na zły wybór byłaby niebieska, gdy powiedzieliby, że coś innego będzie niższe.
W każdym razie ta metoda szacowania daje nam 90% niebieskiego. Obejmuje to 81% szans, że ludzie mówią niebieski, gdy jest, i 9% szans, że ludzie mówią, że nie jest, kiedy jest. Jest to prawdopodobnie najbliższa odpowiedź na pierwotne pytanie i wymaga od nas polegania na danych w celu oszacowania dwóch różnych rzeczy. I założyć, że szansa na wybranie niebieskiego jest taka sama, jak szansa na poprawność niebieskiego.
Jeśli są więcej niż dwa kolory, logika trochę się zmieni. Pierwsze dwie linie pozostają takie same, ale tracimy symetrię w dwóch ostatnich liniach. W takim przypadku potrzebujemy więcej danych. Prawdopodobnie możemy ponownie oszacować szansę poprawnego powiedzenia niebieskiego na 81%, ale nie mamy pojęcia, jakie są szanse, że kolor będzie niebieski, gdy ktoś powie, że tak nie jest.
Moglibyśmy również poprawić nawet szacowanie dwóch kolorów. Biorąc pod uwagę statystycznie znaczącą liczbę samochodów każdego koloru, możemy mieć statystycznie znaczącą liczbę osób, która je wyświetli i skategoryzuje. Następnie moglibyśmy policzyć, jak często ludzie mają rację, kiedy dokonują każdego wyboru koloru i jak często mają rację przy każdym wyborze koloru. Wtedy moglibyśmy dokładniej oszacować rzeczywiste wybory ludzi.
Możesz zapytać, w jaki sposób 90% może się mylić. Zastanów się, co się stanie, jeśli będą trzy kolory: lazurowy, niebieski i szafirowy. Ktoś mógłby rozsądnie uznać wszystkie trzy z nich za niebieskie. Ale chcemy więcej. Chcemy dokładnego odcienia. Ale kto pamięta nazwy innych odcieni? Wielu może zgadywać niebieski, ponieważ jest to jedyny pasujący odcień, jaki znają. I nadal się myl, kiedy okazuje się lazur.
źródło
Dokładny, matematyczny, prawda / fałsz prawdopodobieństwo nie może być obliczona z informacji, które udostępniasz.
Jednak w rzeczywistości takie informacje nigdy nie są dostępne z pewnością. Dlatego korzystając z naszej intuicji (i dokąd trafiłyby wszystkie moje pieniądze, gdybyśmy obstawiali), samochód jest zdecydowanie niebieski. (niektórzy uważają, że to już nie statystyki, ale czarno-białe poglądy na naukę nie są zbyt pomocne)
Rozumowanie jest proste. Załóżmy, że samochód nie jest niebieski. 90% osób (!) Się myliło. Mogą się mylić tylko z powodu listy problemów, w tym:
Ponieważ powyższe nie ma wyraźnego wpływu na 90% przeciętnej populacji losowej (np. Ślepota na kolory dotyka około 8% mężczyzn i 0,6% kobiet, czyli 43 osoby na 1000), koniecznie jest tak, że samochód jest niebieski. (To znaczy, gdyby wszystkie moje pieniądze i tak by poszły).
źródło
Nie zjadłbym kału, ponieważ miliardy much nie mogą się mylić. Może być wiele innych powodów, dla których 900 osób na 1000 mogło zostać oszukanych na myśl, że samochód jest niebieski. W końcu to podstawa magicznych sztuczek, które skłaniają ludzi do myślenia, że coś zostało usunięte z rzeczywistości. Jeśli 900 osób na 1000 zobaczy, jak mag dźgnął swojego asystenta, natychmiast odpowie, że asystent został dźgnięty nożem, ponieważ to nieprawdopodobne, że miało miejsce zabójstwo na scenie. Niebieskie światło na odblaskowej farbie samochodowej, ktoś?
źródło
Ankietowany wie za mało o tym, jak przeprowadzono ankietę, aby odpowiedzieć na pytanie dokładnie. Według niego w ankiecie może wystąpić kilka problemów:
Osoby biorące udział w ankiecie mogły być stronnicze:
Samochód wyglądał na niebieski z powodu iluzji optycznej .
Kolor samochodu był z jakiegoś powodu trudny do zaobserwowania, a ludziom z jakiegoś powodu pokazano wiele niebieskich samochodów przed tym, co sprawia, że większość z nich uważa, że ten samochód też prawdopodobnie był niebieski.
Zapłaciłeś im, żeby powiedzieć, że samochód jest niebieski.
Ktoś zahipnotyzował ich wszystkich, aby uwierzyli, że samochód jest niebieski.
Zawarli pakt o kłamstwie i sabotowaniu ankiety.
Osoby biorące udział w ankiecie mogły mieć związek z tym, jak zostali wybrani lub ze względu na wzajemny wpływ:
Przypadkowo przeprowadziłeś ankietę na spotkaniu masowym dla osób z tym samym rodzajem ślepoty na kolory.
Ankietę przeprowadziłeś w przedszkolach; dziewczynki nie były zainteresowane samochodem, a większość chłopców miała niebieski kolor jako ulubiony kolor, przez co wyobrażali sobie, że samochód jest niebieski.
Pierwsza osoba, której pokazano samochód, była pijana i pomyślała, że ma niebieski kolor, krzyknęła „TO JEST NIEBIESKA”, co sprawiło, że wszyscy myśleli, że samochód jest niebieski.
Tak więc, chociaż prawdopodobieństwo, że samochód jest niebieski, jeśli ankieta została całkowicie poprawnie przeprowadzona, jest bardzo wysokie (jak wyjaśniono w odpowiedzi Ruben van Bergen), wiarygodność ankiety mogła zostać zagrożona, co sprawia, że samochód nie jest niebieski nieistotny. To, jak duża osoba oceniająca oceni tę szansę, zależy ostatecznie od jego oceny, jak prawdopodobne jest, że okoliczności popsuły się ankietą oraz od tego, jak dobry jesteś w przeprowadzaniu ankiet (i jak złośliwy on myśli, że jesteś).
źródło
Jaka jest definicja „niebieskiego”?
Różne kultury i języki mają różne pojęcia niebieskiego. IIRC, niektóre kultury obejmują zieleń w ich pojęciu niebieskiego!
Jak każde słowo w języku naturalnym, można jedynie założyć, że istnieje konwencja kulturowa określająca, kiedy (a kiedy nie) nazywać rzeczy „niebieskim”.
Ogólnie rzecz biorąc, kolor w języku jest zaskakująco subiektywny (link z poniższych komentarzy, dzięki @Count Ibilis)
źródło
Prawdopodobieństwo, w zależności od bardziej wyrafinowanych warunków wstępnych, może wynosić kilka różnych wartości, ale 99,995% jest dla mnie najbardziej sensowne.
Wiemy z definicji, że samochód jest niebieski (to 100%), ale nie jest dokładnie określone, co to właściwie oznacza (to byłoby trochę filozoficzne). Zakładam, że coś jest niebieskie w tym sensie, że można je zobaczyć jako niebieskie.
Wiemy również, że 90% badanych osób zgłosiło to jako niebieskie.
Mamy nie wiedzieć co pytano czy jak ocena została wykonana, a co oświetlenie warunki samochód był w. Być poprosi o podanie nazwy koloru, niektórzy pacjenci mogą na przykład powiedzieć „zielono-niebieski” ze względu na warunki oświetlenia, a oceniający może nie liczyłem tego jako „niebieskiego”. Ci sami ludzie mogliby odpowiedzieć „tak”, gdyby pytanie brzmiało „Czy to jest niebieskie?”. Zakładam, że nie zamierzałeś oszukiwać swoich poddanych testowi.
Wiemy, że częstość występowania tritanopy wynosi około 0,005%, co oznacza, że gdyby samochód można było rzeczywiście uznać za niebieski , wówczas 99,995% badanych rzeczywiście widziało kolor niebieski. Oznacza to jednak, że 9,995% badanych nie zgłosiło koloru niebieskiego, gdy wyraźnie zobaczyło kolor niebieski. Kłamali o tym, co zobaczyli. Jest to bliskie temu, co mówi ci również twoje doświadczenie życiowe: ludzie nie zawsze są szczerzy (ale, o ile nie ma motywu, zwykle są).
Zatem osoba niepostrzegająca może z ogromną pewnością założyć, że samochód jest niebieski. To byłoby 100%
Z wyjątkiem ... z wyjątkiem sytuacji, gdy osoba niepostrzegająca sama cierpi na tritanopy, w którym to przypadku nie widziałaby samochodu jako niebieskiego, mimo że wszyscy inni (a raczej 90% z nich) tak mówi. Tutaj znów zaczyna się filozofować: jeśli wszyscy słyszeli, jak pada drzewo, a ja nie, to czy pada?
Śmiem twierdzić, że najbardziej sensowną i praktyczną odpowiedzią byłoby: jeśli osoba nieobserwująca okazuje się być trianopą (szansa 0,005%), to sprawdzenie, czy przewidywany kolor i rzeczywisty kolor są takie same, dałoby fałsz. Zatem prawdopodobieństwo wynosi 99,995%, a nie 100%.
Co więcej, jako bonus, odkąd dowiedzieliśmy się, że 9,995% badanych to kłamcy, i wiadomo, że wszyscy Kreteńczycy są kłamcami , możemy stwierdzić, że nie jesteśmy na Krecie!
źródło
Jest w 100% niebieski.
Używanie tych liczb (bez żadnego kontekstu) jest całkowicie nonsensowne. Wszystko sprowadza się do osobistej interpretacji pytania. Nie powinniśmy podążać tą ścieżką i użyć Wittgensteina: „Wovon man nicht sprechen kann, darüber muss man schweigen”.
Wyobraź sobie następujące pytanie do porównania:
Jest to zasadniczo ten sam problem (mniej informacji), ale o wiele bardziej jasne jest, że to, co myślimy o kolorze samochodu, jest w większości (jeśli nie całkowicie) poszlakowe.
Na dłuższą metę, kiedy otrzymamy wiele powiązanych pytań, możemy zacząć zgadywać odpowiedzi na takie niekompletne pytania. To samo dotyczy algorytmu tit-for-tat, który nie działa w pojedynczym przypadku, ale działa na dłuższą metę . W tym samym sensie Wittgenstein powrócił ze swojej wcześniejszej pracy z głównymi badaniami . Jesteśmy w stanie odpowiedzieć na te pytania, ale potrzebujemy więcej informacji / prób / pytań. To jest proces.
źródło
Jeśli założymy, że samochód jest niebieski, to 100 na 1000, mówiąc, że nie jest niebieski, oznacza ekstremalne odchylenie próbki. Być może próbowałeś tylko ludzi ślepych na kolory. Jeśli założymy, że samochód nie jest niebieski, to odchylenie próbki jest jeszcze gorsze. Na podstawie podanych danych możemy jedynie wyciągnąć wniosek, że próbka jest bardzo stronnicza, a ponieważ nie wiemy, jak była stronnicza, nie możemy wyciągnąć żadnych wniosków na temat koloru samochodu.
źródło
Było kilka odpowiedzi. W żadnym wypadku nie jestem guru matematyki, ale cóż, oto moja.
Mogą istnieć tylko 4 możliwości:
Z pytania wiadomo, że suma przypadku 1 i przypadku 4 wynosi 900 osób (90%), a suma przypadku 2 i przypadku 3 wynosi 100 osób (10%). Ale tutaj jest haczyk: to, czego nie wiesz, to rozkład w tych dwóch parach przypadków. Może suma przypadków 1 i 4 całkowicie składa się z przypadku 1 (co oznacza, że samochód jest niebieski), a może cała suma składa się z przypadku 4 (co oznacza, że samochód nie jest niebieski). To samo dotyczy sumy przypadku 2 + 3. Więc ... Musisz wymyślić jakiś sposób, aby przewidzieć rozkład w sumach przypadków. Bez żadnego innego wskazania w pytaniu (nigdzie nie jest powiedziane, że ludzie są w 80% pewni, że znają swoje kolory itp.), Nie ma sposobu, aby uzyskać określoną, jednoznaczną odpowiedź.
Powiedziawszy to ... Podejrzewam, że oczekiwana odpowiedź jest następująca:
gdzie pozostałe 50% jest po prostu nieznane, nazwij to marginesem błędu.
źródło
źródło
Osoba, która nie widzi samochodu, nie wie, że jest naukowo udowodniony, że jest niebieski. Prawdopodobieństwo, że samochód jest niebieski, wynosi 50/50 (jest niebieski lub nie jest). Sondowanie innych osób może wpłynąć na opinię tej osoby, ale nie zmienia to prawdopodobieństwa, że niewidziany samochód będzie niebieski albo nie.
Wszystkie powyższe obliczenia określają prawdopodobieństwo, że zestaw próbek może ustalić, czy jest niebieski.
źródło