Jestem całkowicie nowy w statystykach i zakresie przedziałów ufności. Może to być bardzo trywialne lub nawet głupie. Byłbym wdzięczny, gdybyś mógł pomóc mi zrozumieć lub wskazać mi literaturę / tekst / blog, który wyjaśnia to lepiej.
Widzę na różnych serwisach informacyjnych, takich jak CNN, wiadomości Fox, Politico itp., O ich sondażach dotyczących amerykańskiego wyścigu prezydenckiego w 2012 r. Każda agencja przeprowadza sondaże i podaje pewne statystyki dotyczące formy:
CNN: Popularność Obamy wynosi X% z marginesem błędu +/- x1%. Wielkość próbki 600. FOX: Popularność Obamy wynosi Y% z marginesem błędu +/- y1%. Wielkość próby 800. XYZ: Popularność Obamy wynosi Z% z marginesem błędu +/- z1%. Wielkość próby 300.
Oto moje wątpliwości:
Jak zdecydować, któremu zaufać? Czy powinien być oparty na przedziale ufności, czy powinienem założyć, że skoro Fox ma większą próbkę, jej oszacowanie jest bardziej wiarygodne? Czy istnieje ukryty związek między okresami ufności a wielkością próby, tak że określenie jednego pozwala uniknąć konieczności określenia drugiego?
Czy mogę określić standardowe odchylenie od przedziałów ufności? Jeśli tak, to czy jest ważne zawsze, czy tylko dla niektórych rozkładów (jak Gaussa)?
Czy istnieje sposób „scalenia” lub „połączenia” powyższych trzech oszacowań i uzyskania własnych oszacowań wraz z przedziałami ufności? Jaką próbkę mam w takim przypadku wybrać?
Wspomniałem o CNN / Fox tylko po to, by lepiej wyjaśnić mój przykład. Nie mam zamiaru rozpoczynać tutaj debaty Demokraci przeciwko republikanom.
Pomóż mi zrozumieć poruszone przeze mnie problemy.
To ogromny temat, ale zasadniczo są dwa problemy:
1) Precyzja - zależy od wielkości próbki. Większe próbki dają bardziej precyzyjne oszacowania z niższym błędem standardowym i krótszymi przedziałami ufności
2) Odchylenie - które w statystykach niekoniecznie ma negatywne konotacje, jakie ma gdzie indziej. W ankietach starają się uzyskać losową próbkę XXXX (czasami prawdopodobni wyborcy, czasem zarejestrowani wyborcy). Ale oni nie. Niektóre ankiety używają tylko linii naziemnych. Różne grupy ludzi są bardziej lub mniej skłonne do odpowiedzi. Różne grupy raczej po prostu się rozłączają.
Tak więc wszyscy ankieterzy ważą swoje odpowiedzi. Oznacza to, że starają się dostosować swoje wyniki do znanych faktów dotyczących wyborców. Ale wszyscy robią to trochę inaczej. Tak więc, nawet przy tych samych danych wejściowych odpytywania, podadzą różne liczby.
Komu zaufać? Cóż, jeśli spojrzysz na pracę Nate'a Silvera z 538 roku, ma on oceny, jak dokładne były ankieterki w poprzednich wyborach. Ale to nie znaczy, że będą teraz równie dokładne.
źródło
Obejmuje to obszar pobierania próbek z badań. Zasadniczo metody działają, ponieważ stosowana jest randomizacja. Oto rzeczy, które mogą się różnić w ankietach opartych na subiektywnych decyzjach.
Ramka próbkowania. Z jakiej grupy wyborców powinienem pobrać próbkę?
Jak poradzić sobie ze zmiennością niezdecydowanego wyborcy, który może zmienić swoją opinię na temat Obamy vs Romney na podstawie wczorajszego sondażu lub przyszłych tygodni?
Peter dotknął uprzedzeń. Sondaż literacki z 1936 roku był katastrofą. Wybrał kandydata republikańskiego niż FDR, ponieważ ramka próbkowania była oparta na losowym wyborze numerów telefonicznych. W 1936 roku tylko wyższa klasa średnia i bogaci mieli telefony. Ta grupa była zdominowana przez republikanów, którzy mają tendencję do głosowania na republikańskiego kandydata. Roosevelt wygrał przez osunięcie się ziemi, zdobywając głosy od biednych i klasy średniej, która zwykle była grupą demokratów! To ilustruje stronniczość z powodu subtelnie złego wyboru ramki próbkowania.
Próbkowanie w ankiecie dotyczy populacji skończonych. Wielkość populacji to N. Powiedzmy, że z tej populacji pochodzi losowa próbka o wielkości n. Dla uproszczenia załóżmy, że biegają tylko Obama i Romney. Odsetek głosów, jakie Obama uzyskałby za tę ramkę próbkowania, jest średnią zmiennych binarnych (powiedz 1, jeśli respondent wybiera Obamę, a 0 dla Romneya). Wariancja średniej próbki dla tej zmiennej wynosi [p (1-p) / n] [Nn] / N, gdzie p jest prawdziwą proporcją populacji, która wybrałaby Obamę. [Nn] / N jest skończoną korektą populacji. w większości sondaży N jest znacznie większy niż N i poprawność można zignorować. Patrząc na p (1-p) / n widzimy, że wariancja maleje wraz z n. Więc jeśli n jest duże, przedział ufności na danym poziomie ufności będzie mały.
Ankieterzy innych próbników i statystycy z US Census Bureau dysponują tymi narzędziami statystycznymi i wykonują bardziej złożone i dokładne metody (losowa próbka skupisk i losowe próbkowanie warstwowe, aby wspomnieć o kilku metodach).
Gdy ich założenia dotyczące modelowania są prawidłowe, metody działają wyjątkowo dobrze. Wyjście z pollingu jest tego najlepszym przykładem. W dniu wyborów zobaczysz, że sieci dokładnie projektują zwycięzcę w prawie każdym stanie na długo przed końcową liczbą. To dlatego, że zmienność dnia przedwyborczego zniknęła. Historycznie wiedzą, w jaki sposób ludzie głosowali, i mogą określić wybrane obwody w sposób pozwalający uniknąć stronniczości. Sieci czasami się różnią. Może to wynikać z rywalizacji o wyłonienie zwycięzcy przed mentalnością innych. W rzadkich przypadkach może tak być również dlatego, że głosowanie jest bardzo bliskie (np. Wybory Prezydenckie 2000 na Florydzie).
Mam nadzieję, że da to wyraźniejszy obraz tego, co się dzieje. Nie widzimy już poważnych błędów, takich jak „Dewey pokonuje Trumana” w 1948 r. Lub fiasko Literary Digest z 1936 r. Ale statystyki nie są doskonałe, a statystycy nigdy nie mogą powiedzieć, że są pewni.
źródło