Prawdopodobieństwo pojedynczego zdarzenia w przyszłości: co to znaczy, że „Hillary ma 75% szans na wygraną”?

79

Ponieważ wybory są zdarzeniem jednorazowym, nie można powtórzyć eksperymentu. Co dokładnie oznacza technicznie stwierdzenie „Hillary ma 75% szans na wygraną” ? Szukam statystycznie poprawnej definicji, a nie intuicyjnej czy konceptualnej.

Jestem fanem statystyk amatorskich, który próbuje odpowiedzieć na to pytanie, które pojawiło się w dyskusji. Jestem prawie pewien, że istnieje na to dobra obiektywna reakcja, ale sam nie mogę tego wymyślić ...

pitosalas
źródło
4
Ponieważ w sondażach nie ma oszacowań probabilistycznych i bez dalszego kontekstu, wydaje się, że to stwierdzenie opiera się na bieżących wynikach jednego z rynków prognoz, np. Rynku elektronicznego w Iowa (patrz tippie.uiowa.edu/iem ). Dokładniejsze wyjaśnienia znajdują się na stronie Metodologii lub w wielu artykułach na temat rynków prognoz.
Mike Hunter,
13
Kluczową kwestią jest tutaj to, czy możemy przypisać prawdopodobieństwa wyjątkowym (tj. Jednorazowym) zdarzeniom, w których nie możemy zastosować prawdopodobieństw empirycznych w sposób „jeśli rzucę uczciwą kostką wiele razy, proporcja razy I rzuć szóstką zbliży się do szóstej ”. Istnieje jednak argument, że sam subiektywny stopień przekonania powinien w praktyce nadal zachowywać się jak „prawdopodobieństwo” - bardziej technicznie, powinien być zgodny z aksjomatami prawdopodobieństwa. Tak więc filozoficzne podejście do tego pytania może odnosić się do tak zwanego argumentu księgi holenderskiej .
Silverfish,
19
Stanie się 75% rzeczy, które mają 75% szansy na wydarzenie.
immibis
2
To zależy od źródła instrukcji; w niektórych przypadkach odnosi się do prawdopodobieństwa na podstawie pewnego modelu, na przykład (jak w przypadku ocen prawdopodobieństwa na fivethirtyeight.com), ale w innych przypadkach odnosi się do innego kontekstu, może oznaczać coś innego.
Glen_b,
3
Czytałem z tego, że z sondaży oczekiwanym wynikiem Clintona jest zwycięstwo, ale przedział ufności liczb jest taki, że istnieje 25% szans, że rzeczywisty wynik nie jest taki sam, jak oczekiwany wynik.
JimmyB,

Odpowiedzi:

60

Wszystkie dotychczasowe odpowiedzi są pomocne, ale nie są zbyt dokładne statystycznie, więc spróbuję. Jednocześnie udzielę ogólnej odpowiedzi, zamiast skupiać się na tych wyborach.

Pierwszą rzeczą, o której należy pamiętać, gdy staramy się odpowiedzieć na pytania dotyczące wydarzeń w świecie rzeczywistym, takich jak wygrywanie wyborów przez Clintona, w przeciwieństwie do wymyślonych problemów matematycznych, takich jak wyciąganie piłek o różnych kolorach z urny, jest to, że nie ma unikalny rozsądny sposób na udzielenie odpowiedzi na pytanie, a zatem nie unikalna rozsądna odpowiedź. Jeśli ktoś po prostu powie „Hillary ma 75% szans na wygraną” i nie będzie dalej opisywać swojego modelu wyborów, danych, których użył do oszacowania, wyników walidacji modelu, założeń tła, czy odnoszą się do głosowania powszechnego lub wyborczego itp., wtedy tak naprawdę nie powiedzieli ci, co mają na myśli, a tym bardziej nie dostarczyli wystarczających informacji, aby ocenić, czy ich przewidywania są dobre. Poza tym to nie jest

Jakie więc procedury może zastosować statystyk, aby oszacować szanse Clintona? Rzeczywiście, w jaki sposób mogą oni sformułować problem? Na wysokim poziomie istnieją różne pojęcia samego prawdopodobieństwa, z których dwa najważniejsze to częste i bayesowskie.

  • W opinii częstokroć prawdopodobieństwo reprezentuje ograniczającą częstotliwość zdarzenia w wielu niezależnych próbach tego samego eksperymentu, jak w prawie dużych liczb (silnych lub słabych). Chociaż poszczególne wybory są wyjątkowym wydarzeniem, ich wynik można postrzegać jako czerpanie z nieskończonej populacji wydarzeń zarówno historycznych, jak i hipotetycznych, które mogą obejmować wszystkie amerykańskie wybory prezydenckie, wszystkie wybory na świecie w 2016 r. Lub coś innego. 75% szansy na zwycięstwo w Clinton oznacza, że ​​jeśli jest sekwencją wyników (0 lub 1) niezależnych wyborów, które są całkowicie równoważne z tymi wyborami, jeśli chodzi o nasz model, wówczas średnia próbki zbiega się w prawdopodobieństwie do 0,75 jakoX 1 , X 2 , , X n nX1,X2,X1,X2,,Xnn idzie w nieskończoność.

  • W ujęciu bayesowskim prawdopodobieństwo reprezentuje stopień wiarygodności lub wiarygodności (która może, ale nie musi być faktycznym przekonaniem, w zależności od tego, czy jesteś subiektywistycznym bayesowskim). Szansa 75% na zwycięstwo w Clinton oznacza, że ​​wygra ona w 75%. Z kolei wiarygodność można wybierać dowolnie (w oparciu o istniejące przekonania modelu lub analityka) w ramach ograniczeń podstawowych praw prawdopodobieństwa (takich jak twierdzenie Bayesa oraz fakt, że prawdopodobieństwo wspólnego zdarzenia nie może przekraczać krańcowego prawdopodobieństwa któregokolwiek z zdarzenia składowe). Jednym ze sposobów podsumowania tych przepisów jest to, że jeśli obstawiasz wynik wydarzenia, oferując szanse graczom zgodnie z twoimi wiarygodnościami, to żaden gracz nie może stworzyć holenderskiej książkiprzeciwko tobie, to znaczy zestaw zakładów, które gwarantują, że stracisz pieniądze bez względu na to, jak naprawdę wydarzenie się uda.

Niezależnie od tego, czy podchodzisz do poglądów prawdopodobieństwa czy bayesowskiego, wciąż istnieje wiele decyzji, które należy podjąć, aby przeanalizować dane i oszacować prawdopodobieństwo. Być może najpopularniejsza metoda oparta jest na modelach regresji parametrycznej, takich jak regresja liniowa. W tym ustawieniu analityk wybiera parametryczną rodzinę rozkładów (czyli miary prawdopodobieństwa ) indeksowaną przez wektor liczb zwanych parametrami. Każdy wynik jest niezależną zmienną losową pochodzącą z tego rozkładu, przekształconą zgodnie ze zmiennymi towarzyszącymi, które są znanymi wartościami (takimi jak stopa bezrobocia), które analityk chce wykorzystać, aby przewidzieć wynik. Analityk wybiera oszacowania wartości parametrów na podstawie danych i kryterium dopasowania modelu, takiego jak najmniejsze kwadratylub maksymalne prawdopodobieństwo . Korzystając z tych oszacowań, model może wygenerować prognozę wyniku (być może tylko pojedynczą wartość, ewentualnie przedział lub inny zestaw wartości) dla dowolnej wartości współzmiennych. W szczególności może przewidzieć wynik wyborów. Oprócz modeli parametrycznych istnieją modele nieparametryczne (czyli modele zdefiniowane przez rodzinę rozkładów indeksowanych nieskończenie długim wektorem parametrów), a także metody decydowania o przewidywanych wartościach, które nie wykorzystują modelu, w którym dane zostałyby wygenerowane , takie jak klasyfikatory najbliższych sąsiadów i losowe lasy .

Wymyślanie prognoz to jedno, ale skąd wiesz, czy są one dobre? W końcu wystarczająco niedokładne prognozy są gorsze niż bezużyteczne. Testowanie prognoz jest częścią większej praktyki sprawdzania poprawności modelu, to znaczy ilościowego określania, jak dobry jest dany model dla danego celu. Dwie popularne metody sprawdzania poprawności prognoz to sprawdzanie poprawności krzyżowej i dzielenie danych na podzbiory szkoleniowe i testowe przed dopasowaniem jakichkolwiek modeli. W zakresie, w jakim wybory zawarte w danych są reprezentatywne dla wyborów prezydenckich w USA w 2016 r., Oszacowania dokładności prognostycznej, które uzyskamy z zatwierdzania prognoz, poinformują nas o tym, jak dokładne będą nasze przewidywania dotyczące wyborów prezydenckich w USA w 2016 r.

Kodiolog
źródło
Bardzo podoba mi się ta odpowiedź, wskazując, że spodziewałem się dwóch wspólnych punktów widzenia. Myślę, że mniej byłoby więcej.
Mike Wise,
4
Istnieje już kilka zwięzłych odpowiedzi. Chciałem spróbować bardziej kompletnej.
Kodiolog,
7
Nie sądzę, by pogląd częstych mógł być uzasadniony. Wydarzenie takie jak wybory jest z natury nieprzypadkowe. Jeśli powtórzysz wybory milion razy w dokładnie takich samych warunkach, otrzymasz ten sam wynik milion razy. Po prostu sztucznie wprowadzamy losowość do naszych modeli, aby zrekompensować naszą niepełną znajomość warunków.
Stefan
6
To nie jest kontrowersyjny problem w filozofii statystyki. Moim zdaniem żaden model nie jest dosłownie prawdziwy, ale niektóre modele są bardziej przydatne niż inne.
Kodiolog,
32

Kiedy statystycy chcą przewidzieć wynik binarny (Hillary wygrywa kontra Hillary nie wygrywa), wyobrażają sobie, że wszechświat rzuca wyimaginowaną monetę - Heads, Hillary wygrywa; ogony, traci. Dla niektórych statystyk moneta przedstawia stopień ich wiary w wynik; dla innych moneta przedstawia to, co mogłoby się zdarzyć, gdybyśmy ponownie przeprowadzili wybory w tych samych okolicznościach w kółko. Filozoficznie rzecz biorąc, trudno jest zrozumieć, co mamy na myśli, gdy mówimy o niepewnych przyszłych wydarzeniach, nawet zanim wciągniemy w to liczby. Ale możemy spojrzeć na to, skąd pochodzi liczba.

W tym momencie wyborów mamy sekwencję wyników ankiety. Mają one postać: 1000 osób zostało ankietowanych w, powiedzmy, Ohio. 40% wsparcia Trump, 39% wsparcia Hillary, 21% jest niezdecydowanych. Byłyby podobne sondaże z poprzednich wyborów dla odpowiednich kandydatów Demokratów, Republikanów (i innych partii śladowych). W odniesieniu do poprzednich lat istnieją również wyniki. Być może wiesz, że powiedzmy, że kandydaci, którzy uzyskali 40% głosów w ankiecie w lipcu, wygrali 8 z 10 poprzednich wyborów. Albo wyniki mogą powiedzieć, że w 7 na 10 wyborów Demokraci zajęli Ohio. Być może wiesz, jak Ohio wypada w porównaniu z Teksasem (być może nigdy nie wybierają tego samego kandydata) - możesz mieć informacje o tym, jak rozpada się niezdecydowany głos - i możesz mieć ciekawe modele tego, co dzieje się, gdy kandydat zaczyna „gwałtownie wzrastać”.

Biorąc pod uwagę poprzednie wybory, można powiedzieć, że moneta wyborcza została już kilka razy wyrzucona. Te same wybory nie są powtarzane co 4 lata, ale możemy udawać, że tak jest. Na podstawie wszystkich tych informacji ankieterzy budują złożone modele, aby przewidzieć wyniki na ten rok.

75% szansy Hillary na wygraną zależy od naszego stanu wiedzy „dzisiaj”. Mówi, że kandydat z rodzajem wyników ankiety, którą ma „teraz”, w stanach, w których je ma, i biorąc pod uwagę trendy w swoich ankietach w całej kampanii, wygrywa wybory w 3 latach wyborów z 4. Miesiąc od teraz zmieni się jej prawdopodobieństwo wygranej, ponieważ model będzie oparty na stanie sondaży w sierpniu.

Stany Zjednoczone nie miały w swojej historii statystycznie dużej liczby wyborów, a tym bardziej od czasu rozpoczęcia głosowania. Nie możemy też być pewni, że nadal obowiązują trendy wyborcze z, powiedzmy, lat 70-tych. To wszystko jest trochę podejrzane.

Najważniejsze jest to, że Hillary powinna rozpocząć pracę nad przemówieniem inauguracyjnym.

Placidia
źródło
1
Nadal ma przemówienie o nominacji, które musi przejść jako pierwsze.
WBT,
26

Gdy mówią to statystyki, nie odnoszą się do marginesu zwycięstwa ani udziału w głosowaniu. Przeprowadzają dużą liczbę symulacji wyborów i liczą jaki procent głosów uzyska każdy kandydat. Dla wielu solidnych modeli prezydenckich mają prognozy dla każdego stanu. Niektóre są bliskie i jeśli wyścig zostanie przeprowadzony wiele razy, obaj kandydaci mogą wygrać. Ponieważ przedziały prognozowania wielokrotnie pokrywają się z marginesem zwycięstwa wynoszącym 0, nie jest to odpowiedź binarna, ale zamiast tego symulacja powie nam dokładniej, czego się spodziewać.

Strona metodologii FiveThirtyEight może nieco lepiej zrozumieć, co jest pod maską: http://fivethirtyeight.com/features/a-users-guide-to-fivethirtyeights-2016-general-election-forecast/

a.powell
źródło
17

Istnieje odcinek radia freakonomics, który jest bardzo istotny dla tego pytania (ogólnie rzecz biorąc, nie w szczegółach dotyczących wyborów). W nim Stephen Dubner przeprowadza wywiad z szefem projektu z amerykańskiej agencji obrony, aby ustalić najlepszy sposób prognozowania globalnych wydarzeń politycznych.

Pomaga również [więcej] dowiedzieć się więcej o polityce niż większość ludzi. Powiedziałbym, że są to prawie niezbędne warunki do osiągnięcia dobrego wyniku. Ale nie są wystarczające, ponieważ jest mnóstwo ludzi, którzy są bardzo mądrzy i blisko siebie. Jest wielu ludzi, którzy są bardzo mądrzy i uważają, że niemożliwe jest przypisanie prawdopodobieństwa wyjątkowym wydarzeniom .

Następnie dyskutują, czego nie robić

jeśli zadajesz tego rodzaju pytania, większość ludzi mówi: „Jak możesz przypisać prawdopodobieństwa tym, co wydaje się być wyjątkowym wydarzeniem historycznym?” Po prostu nie wydaje się, aby można to zrobić. Najlepsze, co możemy naprawdę zrobić, to używać niejasnego języka, tworzyć niejasne prognozy. Możemy powiedzieć: „Cóż, to może się zdarzyć. To może się zdarzyć. To może się zdarzyć. ”A powiedzenie, że coś może się zdarzyć, nie znaczy wiele.

Następnie odcinek przedstawia metodologie, które najbardziej udani prognostycy zastosowali do oszacowania tych prawdopodobieństw, opowiadając się za nieformalnym podejściem bayesowskim

Tak więc, nie wiedząc nic o afrykańskim dyktatorze ani nawet kraju, powiedzmy, że nigdy nie słyszałem o tym dyktatorze, nigdy nie słyszałem o tym kraju, po prostu patrzę na stawkę podstawową i mówię: „hmm, wygląda jak około 87 procent. ”To byłby mój początkowy szacunek. Zatem pytanie brzmi: „Co mam zrobić?” Cóż, wtedy zaczynam się uczyć o kraju i dyktatorze. A jeśli dowiem się, że dyktator ma 91 lat i ma zaawansowanego raka prostaty, powinienem dostosować moje prawdopodobieństwo . A jeśli dowiem się, że w stolicy dochodzi do zamieszek, a podczas ofensywy pojawiają się ślady wojskowych zamachów, powinienem ponownie dostosować swoje prawdopodobieństwo . Ale zaczynając od prawdopodobieństwa stopy bazowej, jest to dobry sposób, aby przynajmniej upewnić się, że na początku znajdziesz się w polu wiarygodności.

Odcinek nazywa się Jak być mniej strasznym w przewidywaniu przyszłości i słuchanie go jest bardzo zabawne. Zachęcam do sprawdzenia, czy jesteś zainteresowany tego rodzaju rzeczami!

Matthew Drury
źródło
3
+1. W starszym poście naszkicowałem to podejście na przykład. Chciałem to zrobić w sposób neutralny w odniesieniu do debaty bayesowskiej vs. częstej, wskazując, że metody bayesowskie nie są jedynym sposobem szacowania prawdopodobieństwa, sporządzania prognoz lub dostarczania użytecznych informacji o pozornie wyjątkowych wydarzeniach. Próbowałem dokładnie określić, jaką rolę odgrywa prawdopodobieństwo w takich analizach, i domyślnie podkreślić potrzebę dokładnego oszacowania prawdopodobieństwa (zamiast po prostu uzupełnić je w jakiś „nieinformacyjny” sposób).
whuber
1
Z tym wątkiem wiąże się tak zwana kontrowersja „gorących rąk”. W wyjątkowym artykule zatytułowanym Zaskoczony przez hazardzistę i błędy rąk? , Miller i Sanjuro przedstawiają przekonujące dowody na to, że literatura przez dziesięciolecia myliła się, zaprzeczając istnieniu „gorących rąk”. Literatura historyczna opierała się na bezwarunkowym prawdopodobieństwie prób iid Bernoulli, podczas gdy warunkowe prawdopodobieństwo skończonej sekwencji tych samych prób potwierdza intuicję gorących rąk. Podobnie w przypadku wyborów, można traktować te wybory jako wynik sekwencji warunkowo probabilistycznych wyników.
Mike Hunter,
15

Wybory w 2016 r. Są rzeczywiście wydarzeniem jednorazowym. Ale podobnie jest rzut monetą lub rzut kostką.

Gdy ktoś twierdzi, że wie, że kandydat ma 75% szans na wygraną, nie przewiduje wyniku. Twierdzą, że znają kształt kości.

Wynik wyborów nie może tego unieważnić. Ale jeśli model, którego używają do osiągnięcia 75%, zostanie przetestowany w stosunku do wielu wyborów, można wykazać, że ma on ograniczoną wartość predykcyjną. Lub może się urodzić jako cenny.

Oczywiście, gdy cenny predyktor jest znany kandydatom, mogą zmienić swoje zachowanie, a model może stać się nieistotny. Lub może być zdmuchnięty całkowicie nieproporcjonalnie. Spójrz tylko, co dzieje się w Iowa.

candied_orange
źródło
7
+1 za „Twierdzą, że znają kształt kości”.
WBT,
@WBT, nie, to jest całkowicie zły komunikat. 75% nie ma nic wspólnego z (fizycznymi) probabilitami, które (przypuszczalnie) regulują losowe zdarzenia, takie jak rzuty kostkami. Oznacza to, że mają 75% stopień pewności
innisfree
1
@innisfree Metafora jest nadal przydatna. Chociaż w komentarzach do innych odpowiedzi uznaję, że się nie zgadzasz (i możesz opublikować inną odpowiedź), 75% to ktoś, kto twierdzi, że rozkład prawdopodobieństwa wyniku jest równy rozkładowi czworobocznej (piramidalnej) kości, na której trzy z czterech stron jest oznaczony jako „Hillary”. Metafora płynie nieco lepiej, jeśli weźmiesz pod uwagę „kształt”, aby uwzględnić także etykiety.
WBT
6

Kiedy ktoś mówi, że „Hillary ma 75% szans na wygraną”, oznacza to, że jeśli zaoferowałeś mu zakład, w którym jedna osoba otrzyma 25 dolarów, jeśli Hillary wygra, a druga osoba dostanie 75 dolarów, jeśli Hillary nie wygra, to weźmie to pod uwagę uczciwy zakład i nie ma konkretnego powodu, aby preferować którąkolwiek ze stron.

Te wartości procentowe zazwyczaj pochodzą z rynków prognoz. Podsumowują one wszystkie dostępne informacje i zwykle przewyższają analityczne metody przewidywania większości zdarzeń.

Rynki prognostyczne oferują ludziom możliwość postawienia zakładu na to, czy nastąpi określone wydarzenie. Wypłaty są ustalane w drodze negocjacji między ludźmi po obu stronach propozycji. Ogólnie rzecz biorąc, ludzie, którzy mają specjalną wiedzę na temat propozycji, będą próbowali wykorzystać tę wiedzę do zarabiania pieniędzy, co ma efekt uboczny wycieku tej informacji.

Załóżmy na przykład, że istnieje rynek prognoz, czy dana celebrytka będzie żyła do końca tego roku. Społeczeństwo zna wiek celebryty i każdy może sprawdzić podstawowe prawdopodobieństwo, że celebrytka umrze do końca roku. Gdyby to wszystko było znane, można by oczekiwać, że ludzie będą skłonni postawić po jednej lub drugiej stronie tej propozycji z mniej więcej prawdopodobieństwem.

Załóżmy, że ktoś wiedział, że celebrytka ma zły stan zdrowia, ale to ukrywa. Lub nawet powiedzieć, że wiele osób wiedziało, że rodzina celebryty cierpiała na choroby serca, które zmniejszałyby ich szanse na przeżycie. Ludzie posiadający te informacje będą skłonni przyjąć jedną stronę tej propozycji, powodując dostosowanie stawki w momencie, gdy kupujący podniosą cenę akcji, a sprzedawcy ją obniżą.

Innymi słowy, gdy szanse są zbyt niskie, ludzie szukający zysku popychają ich do góry. A kiedy są zbyt wysoko, ludzie szukający zysku popychają ich w dół. Cena zakładu ostatecznie odzwierciedla zbiorową mądrość wszystkich na temat prawdopodobieństwa wystąpienia oferty, podobnie jak wszystkie ceny odzwierciedlają zbiorową mądrość na temat kosztów i wartości rzeczy.

David Schwartz
źródło
2
Szkoda, że ​​żadna inna odpowiedź nie wspomina o zakładach, jest to w zasadzie definicja prawdopodobieństwa… wygląda na to, że wszyscy o tym zapomnieli.
Michael Le Barbier Grünewald
2
@ MichaelGrünewald: Niezupełnie. Chociaż możliwe jest, że szanse hazardowe odzwierciedlają prawdziwe prawdopodobieństwa (takie jak te dotyczące ruletki lub gier karcianych), to nie tak. Szanse na wygraną w wyborach są podobne do cen akcji ... opierają się głównie na tym, jak ludzie się czują.
Robert Harvey
@RobertHarvey Chodzi o to, że prawdopodobieństwa wyrażają subiektywne przekonanie (słowo oczekiwanie powinno nam to przypominać). Tak, mogę budować modele, agregować informacje przy użyciu najmądrzejszych sposobów, ale ostatecznie wszystko, co mogę powiedzieć, to „Biorąc pod uwagę wszystkie dostępne informacje, do których mogę uzyskać dostęp, uważam , że te kursy bukmacherskie są uczciwe”. Nie ma czegoś takiego jak „prawdziwe prawdopodobieństwo” - rachunek prawdopodobieństwa pomaga nam w konsekwencji obliczyć nasze przekonania. Chyba że chcesz zdefiniować „prawdziwe prawdopodobieństwa”.
Michael Le Barbier Grünewald
@RobertHarvey Możesz argumentować, że wszystko opiera się na tym, jak ludzie się czują. Jeśli podniosę argument matematyczny, to dlatego, że uważam, że jest poprawny. Ludzie mają swobodę decydowania o tym, jakie szanse zaakceptować dla zakładu na propozycję dowolną metodą, jaką chcą, dowolną lub rygorystyczną. W dobrej metodzie przewidywania jest wystarczająca liczba osób posiadających informacje, że ostateczny wynik przekazuje mądrość tłumu.
David Schwartz
4

Kluczowym pytaniem jest, w jaki sposób przypisujesz prawdopodobieństwo do unikalnego zdarzenia. Odpowiedź brzmi, że opracowujesz model, dzięki któremu nie jest on już unikalny. Myślę, że łatwiejszym przykładem jest prawdopodobieństwo śmierci prezydenta w biurze? Możesz postrzegać prezydenta jako osobę w pewnym wieku, jako osobę w określonym wieku i płci. Itp ... każdy model daje inną prognozę ... a priori nie ma poprawnego modelu .. to od statystysty zależy, który model będzie najbardziej odpowiedni.

seanv507
źródło
1
Mimo że podałem dłuższą odpowiedź powyżej mojego „poprawnego” znacznika wyboru, to też bardzo mi się podoba. Wyjaśnia to przeniesienie pytania na ryzyko śmierci prezydenta w biurze. Dziękujemy KAŻDEMU za wszystkie przemyślane uwagi!
pitosalas
1
Istnieją ramy (statystyki bayesowskie) do przypisywania prawdopodobieństw (stopni prawdopodobieństwa) każdej hipotezie, w tym wyników wyjątkowych zdarzeń
innisfree
3

Biorąc pod uwagę, że sondaże pokazują bardzo zacięty wyścig, 75% może, ale nie musi być dokładne.

Pytasz, co to znaczy, a nie jak to obliczyli. Sugeruje to, że (jeśli zignorujemy kogoś innego oprócz Clintona i jej jednego głównego przeciwnika), będziesz musiał postawić 3 USD, aby uzyskać zwrot 4 USD, jeśli wygra. Alternatywnie, $ 1 zakład na drugiej biegacz wróci 4 $ jeśli wygra.

Moja odpowiedź wprowadza małe rozróżnienie między faktyczną szansą wygranej przez kandydata a tym, czego oczekują ludzie (gracze lub szanse). Podejrzewam, że kiedy widzisz takie liczby, np. 75%, widzisz liczby bukmacherskie, gdy widzisz 49 do 48%, widzisz wyniki ankiety.

JoeTaxpayer
źródło
2
A ponieważ pytający pyta o znaczenie statystyczne, pamiętaj, że chociaż zwykle nie zdarza się to w wyborach, całkiem możliwe jest, że można przewidzieć „ciasny” wynik, na przykład 52/48, ale nadal mieć 75% zaufania do zwycięzcy bez odniesienia do Vegas po swoje szanse. Na przykład w 100 m finale olimpijskim mężczyzn margines zwycięstwa wyniesie mniej niż 4%, ale model statystyczny może przewidywać prawdopodobnego zwycięzcę. Chodzi o przedział ufności na tym 52/48, który jest wystarczająco duży, gdy przewiduje się wybory, że zwykle nie przekłada się to na 75% szansy.
Steve Jessop,
1
Myślę, że JoeTaxpayer jest bardzo przydatną, pragmatyczną (w filozoficznym znaczeniu tego terminu) perspektywą. Jest to nieco nieprecyzyjna prezentacja teoretyczna. W ten sposób ustawia się zakłady na zakłady równoległe. Inne cechy charakterystyczne mogą być „mądrością tłumu” lub „ceną rynkową”. Naprawdę odpowiada na pytanie, co mogę zrobić z tymi informacjami (zakładając, że w to wierzę)
DWin
1
Nie widziałem wzmianki o kolegium wyborczym. POTUS jest wybierany za pośrednictwem kolegium wyborczego. Tak więc, jeśli Clinton dostanie tylko 51% z 51% elektoratu, i nic z pozostałych, to tylko z ~ 26% popularnego głosowania, wygrywa. Dlatego wyniki sondaży, które generalnie nie biorą pod uwagę kolegium elektorów, są czasami błędne.
MikeP
2
Ankiety @MikeP nie zgłaszają szansy na wygraną, informują, cóż, wyniki ankiety. Modele, które podają szanse na wygraną, wykorzystują dane z ankiet w różnych stanach i uwzględniają kolegium wyborcze - przynajmniej szanowane.
hobbs
2

Jeśli robią to dobrze, dzieje się coś w przybliżeniu w trzech czwartych z tych czasów, kiedy mówią, że ma 75% szansy na wydarzenie. (lub bardziej ogólnie ten sam pomysł dostosowany do wszystkich prognoz procentowych)

Możliwe jest przypisanie większego znaczenia niż to, w zależności od naszych filozoficznych opinii i tego, jak bardzo wierzymy w modele, ale ten pragmatyczny punkt widzenia jest czymś o najniższym wspólnym mianowniku - przynajmniej metody statystyczne próbują (choć być może z boku) efekt, a nie bezpośrednio), aby prognozy były zgodne z tym pragmatycznym punktem widzenia.


źródło
Nie, znaczenie jest wyraźnie epistemologiczne / bayesowskie, 75% stopień przekonania. Nikt nie wyobraża sobie pseudo-eksperymentów, w których wynik wyborów jest zmienną losową.
innisfree
@Innisfree: Jeśli w połowie przypadków masz 75% stopień wiary w coś, co okazuje się błędne, musisz ponownie skalibrować sposób mierzenia swojej wiary! Nie ma potrzeby angażowania wymyślonych eksperymentów, tylko obiektywna miara tego, jak często twoje przekonanie przekładało się na rzeczywistość w przeszłości.