Techniki eksploracji danych w kampanii Obamy

10

Natknąłem się na ten artykuł o zespole eksploracji danych w kampanii reelekcyjnej Obamy. Niestety artykuł jest bardzo niejasny na temat rzeczywistej maszynerii algorytmów statystycznych. Wydawało się jednak, że ogólne techniki są znane w naukach społecznych i politycznych. Ponieważ to nie jest moja specjalizacja, czy ktoś może wskazać mi literaturę (przegląd) na temat tego rodzaju technik?

fabee
źródło

Odpowiedzi:

16

Ten obszar nazywa się mikrotargetowaniem (jeśli chcesz go wyszukać w Google). Kampanie są dość tajne na temat ich narzędzi i procedur, więc o ile wiem, nie ma aż tak dużo opublikowanych prac poza celowaniem politycznym Hal Malchow (2008) lub Green & Gerber (2008). Zdobądź głos: jak zwiększyć frekwencję wyborczą (te ostatnie dotyczą więcej z aspektami nauk społecznych, takimi jak to, które reklamy są skuteczne i takie).

W bardziej technicznych kwestiach literatura jest jeszcze rzadsza, ale patrz np. Murray & Scime (2010) , artykuł Political Analysis autorstwa Imai & Strauss (2011) ( postprint ) lub najnowszy artykuł Annals of Applied Statistics autorstwa Ruscha, Lee, Hornik, Jank & Zeileis (2013) ( postprint ). Łączy je to, że korzystają z technik eksploracji danych, głównie opartych na drzewach.

Murray & Scime używają standardowych drzew klasyfikacyjnych, takich jak CART.

Rusch i in. używać drzew klasyfikacyjnych, modeli logistycznych oraz hybrydy drzew i regresji logistycznej. Wykorzystują także (między innymi) losowe lasy, sieci neuronowe, maszyny wektorów wspierających i drzewa regresji addytywnej Bayesa do porównania z hybrydami drzew, jak opisano w duplice do artykułu . Ich drzewa hybrydowe działały na równi z innymi metodami w swoich zestawach danych i oferują zwiększoną interpretowalność (udostępniamy również ich kod i dane).

Imai i Strauss są interesujące, ponieważ przedstawiają kompleksowe teoretyczne ramy decyzyjne dla optymalnego planowania kampanii, a nie tylko narzędzia do mikrotargetowania, jak robią to inni. Dlatego bardzo koncentrują się na aspektach badań operacyjnych dotyczących tego, jak najlepiej wykorzystać każdy dolar zainwestowany w kampanię. W aspekcie swoich ram, w których stosują techniki statystyczne do mikrotargetowania i szacowania frekwencji, ponownie polegają na drzewach klasyfikacyjnych.

Wydaje się więc, że istnieje pewna zgoda co do tego, że stosowanie metod opartych na drzewach działa dobrze w tym obszarze.

Momo
źródło