Brexit: czy „odejście” było istotne statystycznie? [Zamknięte]

12

W tym poście zadajemy pytanie o naturalne zjawisko zwane próbą podjęcia decyzji przez liczenie głosów . Konkretnym incydentem takiego naturalnego zjawiska, o którym chodzi w tym pytaniu, jest przypadek Brexitu .

Uwaga: pytanie nie dotyczy polityki. Celem jest próba omówienia takiego naturalnego zjawiska ze statystycznego punktu widzenia na podstawie obserwacji.

Konkretne pytanie brzmi:

  • Pytanie: Co oznacza głos Brexit, aby odejść ? Np. Czy to oznacza, że ​​społeczeństwo naprawdę chce opuścić UE? Czy to po prostu oznacza, że ​​społeczeństwo nie jest pewne i potrzebuje więcej czasu na przemyślenie? A może to coś innego?51.9%

Założenie 1: w głosowaniu nie wystąpił błąd.

jaskiniowiec
źródło
14
Demokracja nie polega na znaczeniu statystycznym. Wynik 51,9% oznacza, że ​​51,9% głosujących głosowało za „odejście”. To nie jest sondaż. Ci, którzy nie głosowali, głosowali (nie) swoimi stopami. Interpretacja 51,9% jako „opinia publiczna nie jest pewna i potrzebuje więcej czasu na przemyślenia” to po prostu statystyki. Brexit nastąpił z prawdopodobieństwem 1.
Tim
7
Wątek ten ma być niestatystyczny, opiniotwórczy, a być może nawet polemiczny. To po prostu nie pasuje do tej witryny, niezależnie od jej popularności. Mamy czat wypełniony ludźmi, którzy chętnie angażują się w takie rozmowy: sprawdź to!
whuber
2
Uważam, że obecna dyskusja jest skoncentrowana statystycznie i jest dobrym przykładem interpretacji wyników głosowania w odniesieniu do testów statystycznych.
Underminer
3
Poruszasz ważną kwestię: błąd pomiaru wskaźników opinii publicznej, takich jak ankiety. Obawiam się, że głównym źródłem błędu nie jest wielkość próby.
Aksakal
4
IMHO, jest to pytanie niestatystyczne z cienką warstwą statystyk dodanych w celu ukrycia tego faktu. Kiedy czytam, założenie „nie ma błędu w procesie głosowania” eliminuje wszystkie względy statystyczne i koniecznie kieruje dyskusję na to, co „głosowanie ... oznacza” w demokracji. To kwestia nauk politycznych i filozofii, a nie statystyki.
whuber

Odpowiedzi:

17

Zgadzam się z @Underminer, że nie ma błędu próbkowania, ale nie dlatego, że próbka jest duża, ale dlatego , że próbka nie była zaangażowana . Nikt nie został wybrany do głosowania. Oczywiście była niewielka część ludzi, którzy chcieli głosować, ale nie byli w stanie (np. Miał wypadku samochodowego w tym dniu) lub którzy zrobili nieważne głosy, ale to jedyne „próbkowanie” tutaj.

Wynik jest dokładny, nie ma błędu, ponieważ cała populacja wzięła udział w głosowaniu (niektórzy wzięli udział, nie biorąc udziału w głosowaniu). Niektórzy decydowali się głosować, inni nie. Niektórzy zdecydowali się głosować na urlopie, inni nie. Demokracja nie polega na znaczeniu statystycznym, ale na tym, co się naprawdę wydarzyło . Głosowanie nie ma na celu poznania opinii ludzi, ale podjęcie decyzji. W rzeczywistości ludzie czasami nie głosują zgodnie z tym, co myślą, ale manifestują lub osiągają coś . Na przykład w wyborach ludzie mogą głosować nie na preferowanego kandydata, ale na drugiego preferowanego, jeśli uważają, że ma większe szanse na wygraną.

Tim
źródło
Rozważ przypadek szarej strefy, w której głosująca ludność nie jest pewna, co jest dla nich dobre. Na przykład przypadek posiadania 2 kandydatów, którzy są prawie tak samo dobrzy. W takim przypadku myślę, że ci, którzy głosują, prawdopodobnie będą się różnić niesystematycznie, ponieważ uważam, że ich głosy mogą mieć rozkład zbliżony do jednolitego. Moim celem tutaj nie jest ponowne zdefiniowanie demokracji (temat polityczny), ale raczej sprawdzenie, co możemy powiedzieć o tym, czy Brexit był szarą strefą?
jaskiniowiec
2
@caveman bez względu na to, czy są pewni, czy nie, ważne jest to, jak głosowali, ponieważ głosowanie dotyczy rzeczywistych głosów. Z pewnością niektóre osoby nie miały jasnej opinii, niektóre głosowały, a inne nie, ale to też nie ma znaczenia, ponieważ liczy się faktyczny głos tych, którzy głosowali.
Tim
Jeśli dobrze to rozumiem, chodzi o to, jak demokracja interpretuje głosy? Zgadzam się z Tobą. Nie interpretuję tego jednak tak, jak robią to politycy. Staram się wykorzystać populację do ustalenia, czy decyzja jest dobra, zła, czy niezbyt jasna. Jest to inne zastosowanie głosowania.
jaskiniowiec
2
@ jaskiniowcy ciągle zmieniają zdanie, psychologowie pisali o tym tysiące artykułów ... Tak, 51,9% nie oznacza, że ​​dokładnie 51,9% Brytyjczyków jest w 100% pewna, że ​​opuści UE. Ludzie mogą nawet nie mieć pewności co do porównywania długości linii ( en.wikipedia.org/wiki/Asch_conformity_experiments ) ...
Tim
1
@Aksakal Nie zamierzam komentować, kto jest uprawniony do głosowania, a kto nie. Nie zamierzam też komentować, jak trudne może być uzyskanie niezbędnych poświadczeń. To jest polityka i jako taka nie jest tutaj tematyczna. Ze statystycznego punktu widzenia każdy uprawniony do głosowania ma pewne prawdopodobieństwo niegłosowania. Na to prawdopodobieństwo mogą wpływać pewne czynniki, które mogą, ale nie muszą być związane z ich preferencjami, ale każdy uprawniony do głosowania decyduje się (nie) skorzystać z tego prawa według własnego uznania.
user3697176
9

51,9% to odsetek wyborców, którzy chcą odejść . Ponieważ wielkość próbki jest tak duża (> 33 miliony), praktycznie nie ma przypadkowego błędu próbkowania.

Testy istotności statystycznej spróbowałyby ustalić, czy różnicę w pozostaniu i urlopie można wyjaśnić samym błędem losowania, a różnica z pewnością byłaby znacząca (patrz odpowiedź @ cavemana).

Problem z tym podejściem polega na tym, że istotność statystyczna bardzo mocno zakłada, że ​​próba jest reprezentatywna dla całej populacji (całej Wielkiej Brytanii), nie tylko tych, którzy głosują.

Wskaźnik braku odpowiedzi (tych, którzy nie biorą udziału w głosowaniu) jest niezwykle ważny przy ustalaniu, czy więcej niż połowa całej Wielkiej Brytanii chce „odejść”, i jest trudny do zmierzenia. Błąd polegający na braku odpowiedzi powstaje, gdy podgrupy, które rzadziej głosują, mają systematycznie różne poglądy. Na przykład na podstawie sondaży wyjściowych milenialsi byli mniej skłonni głosować, ale częściej głosowali, aby pozostać , co negatywnie wpływa na wyniki, gdy próbuje reprezentować populację całej Wielkiej Brytanii.

Z tego powodu testowanie istotności statystycznej w tradycyjnym znaczeniu jest w dużej mierze nieodpowiednie .


Założenia: Musimy zdefiniować niektóre warunki, aby którekolwiek z nich miało sens i unikało politycznej dyskusji na temat tego, co głosowanie próbuje osiągnąć. Oto moje definicje:

Ludność: każda osoba mieszkająca w Wielkiej Brytanii

Próbkowanie: każda osoba uprawniona do głosowania, która może głosować

Metodologia próbkowania: dobrowolna reakcja, głosowanie uczestniczy w badaniu

Próbka: osoby, które faktycznie głosują

W tej konfiguracji odsetek próbek można wykorzystać (na lepsze lub gorsze) do oszacowania odsetka wszystkich ludzi, którzy skłaniają się do pozostania (lub odejścia ).

Underminer
źródło
8

Ty pytasz

Co oznacza 51,9% głosowania na Brexit, aby odejść?

Oznacza to, że 51,9% głosujących głosowało za odejściem.

Np. Czy to oznacza, że ​​społeczeństwo naprawdę chce opuścić UE? Czy to po prostu oznacza, że ​​społeczeństwo nie jest pewne i potrzebuje więcej czasu na przemyślenie? A może to coś innego?

17421887161462971293135318

Możliwe, że możliwe byłoby zbudowanie kwestionariusza odpowiadającego na twoje pytania. Nie wydaje się, aby tak się stało w referendum, które zostało wdrożone.

Eric Towers
źródło
1
Czy mógłby Pan przedyskutować znaczenie głosów w stosunku do wyborców (tj. Nie całej populacji), poza powierzchownym wnioskiem, że oznacza to „ 51,9% głosowało za urlopem ”? Zastanawiam się, jaki zakres informacji możemy z tego wyciągnąć.
jaskiniowiec
4
Caveman, ten komentarz, bardziej niż jakikolwiek inny, pokazuje, że twoje pytanie nie jest statystyczne. Ponieważ 51,9% (wraz z całkowitą liczbą) stanowi wszystkie dane dowodowe dotyczące wyborców i nie ma wątpliwości (chyba że chcesz zakwestionować dokładność liczenia, co stanowi osobną kwestię), Twoje odrzucenie tej odpowiedzi oznacza szukasz pozastatystycznych wniosków.
whuber
Co jeśli modelujemy Brexit jako problem klasyfikacji binarnej i traktujemy głosujących jako szacunki klasyfikatorów, którzy są członkami zespołu. W tym modelu celem nie jest zidentyfikowanie tego, czego chce większość obywateli, ale raczej określenie optymalnego klasyfikatora z przestrzeni klasyfikatorów. Następnie możemy zastosować pewne środki do przetestowania dobroci takiego zespołu klasyfikującego opartego na wyborcach ludzkich. Np. Możemy użyć Perplexity lub czegoś innego, co jest odpowiednie do tego zadania klasyfikacji binarnej, gdy podstawowa prawda jest nieznana (np. Wyraźnie nie wiemy, czy urlop jest lepszy niż pozostanie).
jaskiniowiec
@caveman: Biorąc pod uwagę, że podstawowa prawda jest (poprawnie) nieznana, jakiej metryki użyłbyś do „zidentyfikowania optymalnego klasyfikatora z przestrzeni klasyfikatorów”? Każda taka metryka koduje uprzedzenia analityka, który wybiera metrykę, z wyjątkiem metryki „odtwarza wynik głosowania”, dla której metryka już znasz odpowiedź: 51,9% / 48,1%.
Eric Towers
@EricTowers Zaniosłem to na politics.stackexchange.com, gdzie rozmawiałem o różnych metodach - politics.stackexchange.com/questions/11433/…
jaskiniowiec
2

TL; DR

R=100051.9%51.9%

0

48.1%

0

Dlatego dochodzę do wniosku, że głosowanie w sprawie Brexitu nie jest głośnym skutkiem ubocznym niepewnej lub zdezorientowanej populacji. Wydaje się, że istnieje systematyczny powód, dla którego opuszczają UE.

Przesłałem kod symulatora tutaj: https://github.com/Al-Caveman/Brexit

Detale

Biorąc pod uwagę Założenie 1 , możliwe odpowiedzi (lub hipotezy) to:

  • H0
  • H1

Uwaga: to jest niemożliwe, że opinia publiczna pewnie chce pozostać , ponieważ mamy wykluczyć błędów głosu.

H0H1

  • 51.9%
  • 151.9%

H1H0

Aby zmierzyć to prawdopodobieństwo, musimy znać rozkład niepewnej populacji brytyjskiej w systemie binarnego głosowania, jakim jest Brexit. Dlatego moim pierwszym krokiem jest zasymulowanie tego rozkładu zgodnie z poniższym założeniem:

  • Założenie 2: populacja złożona z niepewnych osób będzie miała losowy głos. Tj. Każda możliwa odpowiedź ma równe szanse na wybór.

Moim zdaniem to założenie jest słuszne / uzasadnione.

Dodatkowo modelujemy urlop i pozostawiamy kampanie jako dwa odrębne procesy w następujący sposób:

  • PleaveOleave=[l1,l2,,ln]
  • PremainOremain=[r1,r2,,rn]

gdzie:

  • n
  • i{1,2,,n}li,ri{0,1}01

z zastrzeżeniem następującego ograniczenia:

  • i{1,2,,n}liri1li=1ri=0ri=1li=0i{1,2,,n}

Oleave=[1,0,0]3

Oremain=[0,1,0]3

Oleave[3]=Oremain[3]=0

33,568,18451.9%10051.9=48.1%

  • n=33,568,184
  • 33,568,184×0.519=17,421,887.496
    i=133,568,184Oleave[i]=17,421,887.49617,421,887
  • 33,568,184×(10.519)=16,146,296.504
    i=133,568,184Oremain[i]=16,146,296.50416,146,297

Dlatego tablice wyjściowe definiujemy w następujący sposób:

  • i{1,2,,17421887}Oleave[i]=1
  • i{17421887+1,17421887+2,,33568184}Oleave[i]=0
  • i{1,2,,17421887}Oremain[i]=0
  • i{17421887+1,17421887+2,,33568184}Oremain[i]=1
  • i{1,2,,33568184}Ounsure,m[i]=CC{0,1}mOunsure,mOunsure,mOunsure,1=Ounsure,20.533,568,184

pleave

pleave=1Rm=1R{1if (i=133,568,184Oleave[i])(i=133,568,184Ounsure,m[i])0else
ROunsure,m definiuje.

premain

premain=1Rm=1R{1if (i=133,568,184Oremain[i])(i=133,568,184Ounsure,m[i])0else

R=1,000

total leave votes: 17421887
total remain votes: 16146297
simulating p values............ ok
p value for leave: 0.000000
p value for remain: 0.000000

Innymi słowy:

  • pleave=0
  • premain=0
jaskiniowiec
źródło
2
Być może ważniejszy w tym przypadku jest wskaźnik braku odpowiedzi (tj. Osoby, które nie głosują). Margines błędu (lub miara istotności statystycznej) uwzględnia tylko błąd próby losowej. Nie obejmuje to stronniczości braku odpowiedzi i jest znacznie bardziej wpływowa niż losowy błąd próbkowania przy sondowaniu z tak dużą próbką.
Underminer
46,499,53746,499,537(17421887+16146297)=12,931,353
3
Nie ma statystycznie zadowalającego sposobu radzenia sobie z przypadkowymi brakującymi danymi.
Underminer
Ci, którzy nie głosowali, mogą składać się z osób, którym nie zależy na polityce (np. Nie ma już zaufania). Ewentualnie mogą to być tacy, którzy nie byli pewni. Lub może to być ich mieszanina. Co by się stało, gdybyśmy zakładali, że „ wszyscy nie głosujący są niepewni ”? Czy stanowiłoby to górną granicę dla sprawdzenia, czy obecna sytuacja była taka, że ​​opinia publiczna uważa, że ​​Brexit jest szarą strefą ?
jaskiniowiec
3
Jest tu zamieszanie co do charakteru i zakresu statystyk. Próbujesz stworzyć procesowy model głosowania i to, w jaki sposób może on informować o mechanizmach i ważności zarządzania i podejmowaniu decyzji publicznych. Jest to wartościowe zadanie w naukach politycznych . To po prostu nie są statystyki (chociaż statystyki są w to zaangażowane).
Gung - Przywróć Monikę
1

Możesz zadać nieco inne pytanie: Zakładając, że 50% bardzo dużej populacji głosowało „Tak”, a zapytałeś losową próbkę wielkości S, jakie jest prawdopodobieństwo, że 51,9% twojej próbki odpowiedziało „Tak”, w zależności od wielkość próbki?

S1/2

S1/2(6.10.5/0.019)2

gnasher729
źródło
0

To kolejne rozwiązanie wykorzystujące metodę analityczną zamiast symulacji.

n0.5

51.9%17,421,887Oleave0.533,568,18417,421,887+10.533,568,184

17,421,887

i=17,421,88733,568,1840.533,568,184=(33,568,18417,421,887)×0.533,568,184=8.39663381928984×10101050240

( obliczono WolframAlpha )8.39663381928984×1010105024

I to jest prawdopodobieństwo posiadania danego niepewny głosowanie populacja urlopu .51.9%

jaskiniowiec
źródło