Ten obszar nazywa się mikrotargetowaniem (jeśli chcesz go wyszukać w Google). Kampanie są dość tajne na temat ich narzędzi i procedur, więc o ile wiem, nie ma aż tak dużo opublikowanych prac poza celowaniem politycznym Hal Malchow (2008) lub Green & Gerber (2008). Zdobądź głos: jak zwiększyć frekwencję wyborczą (te ostatnie dotyczą więcej z aspektami nauk społecznych, takimi jak to, które reklamy są skuteczne i takie).
W bardziej technicznych kwestiach literatura jest jeszcze rzadsza, ale patrz np. Murray & Scime (2010) , artykuł Political Analysis autorstwa Imai & Strauss (2011) ( postprint ) lub najnowszy artykuł Annals of Applied Statistics autorstwa Ruscha, Lee, Hornik, Jank & Zeileis (2013) ( postprint ). Łączy je to, że korzystają z technik eksploracji danych, głównie opartych na drzewach.
Murray & Scime używają standardowych drzew klasyfikacyjnych, takich jak CART.
Rusch i in. używać drzew klasyfikacyjnych, modeli logistycznych oraz hybrydy drzew i regresji logistycznej. Wykorzystują także (między innymi) losowe lasy, sieci neuronowe, maszyny wektorów wspierających i drzewa regresji addytywnej Bayesa do porównania z hybrydami drzew, jak opisano w duplice do artykułu . Ich drzewa hybrydowe działały na równi z innymi metodami w swoich zestawach danych i oferują zwiększoną interpretowalność (udostępniamy również ich kod i dane).
Imai i Strauss są interesujące, ponieważ przedstawiają kompleksowe teoretyczne ramy decyzyjne dla optymalnego planowania kampanii, a nie tylko narzędzia do mikrotargetowania, jak robią to inni. Dlatego bardzo koncentrują się na aspektach badań operacyjnych dotyczących tego, jak najlepiej wykorzystać każdy dolar zainwestowany w kampanię. W aspekcie swoich ram, w których stosują techniki statystyczne do mikrotargetowania i szacowania frekwencji, ponownie polegają na drzewach klasyfikacyjnych.
Wydaje się więc, że istnieje pewna zgoda co do tego, że stosowanie metod opartych na drzewach działa dobrze w tym obszarze.