Wczoraj mieszkam w wyborach powszechnych, a sieć telewizyjna zaczęła wzywać zwycięzców na długo przed otwarciem wszystkich kart do głosowania.
Okazały się słuszne na wszystkich kontach i nie jestem zaskoczony, że tak zrobili. Wiem, że statystyki są absolutnie wykonalne. Mimo to jestem ciekawa. Zarozumiały:
- mamy otwarte z głosowaniach;
- mamy kandydatów, których bieżące wyniki to ;
Jak obliczyć pewność, z jaką wiodący kandydat jest zwycięzcą?
Odpowiedzi:
Główną trudnością w praktyce nie jest niepewność statystyczna, że przypadek szczęścia dałby jednemu kandydatowi więcej głosów. Główną trudnością, rzędu wielkości lub większej, jest to, że otwarte karty do głosowania prawie nigdy nie są obiektywną próbą oddanych głosów. Jeśli zignorujesz ten efekt, otrzymasz słynny błąd „Dewey pokonuje Trumana”, który wystąpił w przypadku dużej, stronniczej próbki.
W praktyce wyborcy, którzy faworyzują jednego kandydata w stosunku do drugiego, nie są równo podzieleni według regionu, ze względu na to, czy pracują w ciągu dnia, czy przez to, czy zostaną rozmieszczeni za granicą, dlatego głosują za pomocą nieobecnych kart. To nie są małe różnice.
Myślę, że teraz organizacje informacyjne dzielą populację na grupy i wykorzystują wyniki do oszacowania, jak głosowała każda grupa (w tym frekwencja). Mogą być one oparte na modelach i wcześniejszych założeniach opartych na poprzednich wyborach, a nie tylko na danych z tych wyborów. Nie mogą one uwzględniać osobliwości, takich jak karty do głosowania w Palm Beach.
źródło
Podczas pobierania próbek w ankiecie potrzebny jest błąd standardowy oszacowania proporcji. To zależy bardziej od i niż j. Wymaga to również, aby i otwarte karty do głosowania były wybierane losowo. Jeśli p jest prawdziwą proporcją końcową dla kandydata A, wówczas wariancja oszacowania wynosi
Dokonując projekcji, ankieterzy mogą wybrać losową próbę warstwową ze skumulowanych głosów, aby uniknąć potencjalnego błędu, który może wystąpić, jeśli spojrzy się na wszystkie zliczone głosy. Problem z oglądaniem wszystkich zgromadzonych głosów polega na tym, że niektóre obwody całkowicie liczą się nad innymi i mogą nie być reprezentatywne dla populacji.
Artykuł tutaj zapewnia dobre omówienie problemu i liczne odniesienia.
Zwrócono uwagę, że skumulowane głosy mogą dostarczyć stronnicze oszacowania proporcji, ponieważ albo posterunki, które jeszcze się nie zgłosiły, są posterunkami, które mają tendencję do faworyzowania partii z kandydatem, który jest wleczony, lub kartami do głosowania nieobecnych prawdopodobnie faworyzują kandydata, który jest wleczony i te głosy są liczone jako ostatnie. Wyrafinowani ankieterzy, tacy jak Harris i Gallup, nie wpadają w takie pułapki. Prosta analiza konstruowania przedziałów ufności w oparciu o skumulowane głosy, które nakreśliłam, jest tylko jednym z czynników, który jest stosowany. Ankieterzy mają do dyspozycji znacznie więcej informacji. Mają ankiety, które zostały przeprowadzone na krótko przed wyborami, i mają wzorce głosowania we wszystkich dzielnicach i nieobecne głosy z wyborów w ostatnich latach.
Jeśli więc istnieją wyraźne uprzedzenia, które mogłyby zamykać bliskie wybory w przeciwnym kierunku, ankieterzy to rozpoznają i wstrzymają się z projekcją zwycięzcy.
W Stanach Zjednoczonych karty do głosowania nieobecnych pochodzą głównie od zagranicznych wojskowych i studentów, którzy są w szkole poza domem. Podczas gdy wojsko może być bardziej konserwatywne i może głosować na republikanów, koledzy są bardziej liberalni i mogą głosować na Demokratów. Wszystkie te względy są brane pod uwagę.
Troska i wyrafinowanie współczesnego sondowania powoduje, że od tego czasu nie wystąpiły rażące błędy, takie jak sondaż literacki z 1936 r. Lub przedwczesne ustępstwa gazety z Chicago w wyborach z 1948 r. Do Dewey.
źródło