Mājas Datu bāzes Algoritmu izmantošana vēlēšanu prognozēšanai: tērzēšana ar zīmēto linzeru

Algoritmu izmantošana vēlēšanu prognozēšanai: tērzēšana ar zīmēto linzeru

Anonim

Drew uzstāsies Big Data Innovation samitā 30. un 31. janvārī Lasvegasā: http://analytics.theiegroup.com/bigdata-lasvegas, līdzās runātājiem no Obama for America, Best Buy, LinkedIn, The New York Times, Nokia, Bitly, Barnes & Nobles, Walmart Labs un daudzas citas.


Reģistrācijas saite: http://bit.ly/Zs3wms


Šo interviju veica Džordžs Hils, un tā tika publicēta žurnālā Big Data Innovation.


Kāda ir bijusi reakcija uz jūsu prognozēm?


Lielākā daļa reakcijas bija vērsta uz precizitātes atšķirībām starp tiem, kuri pētīja sabiedriskās domas aptaujas, un populāro domubiedru un komentētāju "zarnu sajūtas" prognozēm. Vēlēšanu dienā tādi datu analītiķi kā es, Nate Sudraba (laikraksts New York Times FiveThirtyEight emuārs), Saimons Džeksmens (Stenfordas universitāte un Huffington Post) un Sems Vangs (Prinstonas vēlēšanu konsorcijs) novērtēja Obamas atkārtotas vēlēšanas iespējas vairāk nekā par 90% un pareizi paredzēja. Par visticamāko iznākumu Obama balsoja 332 vēlēšanās. Tikmēr tādi pundīti kā Kārlis Rove, Džordžs Vils un Stīvs Forbes sacīja, ka Romnijs gūs uzvaru - un dažos gadījumos - viegli. Tas noveda pie runas par "uzvaru kvantiem", kuru es ceru pārnest uz nākamajām vēlēšanām.


Kā jūs vērtējat algoritmu, ko izmantojat jūsu prognozēs?


Manā prognozēšanas modelī tika novērtēti valsts balsojuma rezultāti un galīgais vēlēšanu balsojums katrā kampaņas dienā, sākot no jūnija. Es gribēju, lai šo prognožu novērtējums būtu pēc iespējas taisnīgāks un objektīvāks - un neatstātu man nekādu satraukumu, ja tās būtu nepareizas. Tātad apmēram mēnesi pirms vēlēšanām es savā vietnē ievietoju astoņu vērtēšanas kritēriju kopumu, kuru es izmantotu, tiklīdz rezultāti būs zināmi. Kā izrādījās, modelis strādāja perfekti. Tas vasarā prognozēja, ka Obama uzvarēs visus savus 2008. gada štatus, atskaitot Indiānu un Ziemeļkarolīnu, un tik tikko bija budžetā no šīs prognozes pat pēc tam, kad septembrī tika atbalstīts Obama, bet pēc pirmajām prezidenta debatēm tika iemērkts.


Gan neatkarīgo analītiķu, gan kampaņu komandu šajā kampaņā izmantotais datu apjoms ir bijis milzīgs. Kāda tam ir ietekme uz datu izmantošanu 2016. gadā?


2012. gada kampaņa pierādīja, ka daudzus un dažādus kvantitatīvas informācijas avotus var pārvaldīt, uzticēties un veiksmīgi izmantot dažādiem mērķiem. Mēs, nepiederošie, jau labu laiku spējām paredzēt vēlēšanu iznākumu. Kampaņu laikā tika izdarīti milzīgi panākumi vēlētāju noteikšanā, viedokļu izsekošanā, līdzekļu vākšanā un vēlētāju aktivitātē. Tagad, kad mēs zinām, ka šīs metodes var darboties, es domāju, ka tās vairs neatgriezīsies. Es ceru, ka žurnālisti un kampaņu komentētāji 2016. gadā daudz nopietnāk uztvers aptauju apkopošanu. Lai gan Obama un demokrāti šobrīd šķiet ieguvuši priekšrocības kampaņu tehnoloģijās, es būtu pārsteigts, ja republikāņi ātri netiktu galā.


Vai jūs domājat, ka šīs uz datiem balstītās kampaņas panākumi nozīmē, ka kampaņu vadītājiem tagad jābūt gan analītiķiem, gan stratēģiem?


Iespējams, ka kampaņas vadītājiem pašiem nav jābūt analītiķiem, bet viņiem vajadzētu vairāk novērtēt, kā datus un tehnoloģijas var izmantot viņu labā. Kampaņas vienmēr ir izmantojušas aptauju izpēti, lai formulētu stratēģiju un izmērītu vēlētāju noskaņojumu. Bet tagad ir pieejams virkne citu jaudīgu rīku: sociālo tīklu vietnes, vēlētāju datu bāzes, mobilie viedtālruņi un e-pasta mārketings, lai nosauktu tikai dažus. Un tas ir papildus nesenajiem sasniegumiem vēlēšanu metodoloģijā un statistiskā viedokļa modelēšanā. Amerikas kampaņu politikā šobrīd notiek daudz jauninājumu.


Jums izdevās paredzēt vēlēšanu rezultātus sešus mēnešus iepriekš. Kāds, jūsuprāt, ir reālais maksimālais laika posms, lai precīzi prognozētu rezultātu, izmantojot savas analītikas metodes?


Apmēram četri vai pieci mēneši ir apmēram tikpat tāli, cik zinātne ļauj mums doties tūlīt; un tas pat to mazliet stumj. Pirms tam aptaujas vienkārši nav pietiekami informatīvas par iespējamo iznākumu: pārāk daudz cilvēku ir vai nu neizlēmuši, vai arī nav sākuši pievērst uzmanību kampaņai. Arī vēsturiskie ekonomiskie un politiskie faktori, kuriem ir pierādīta korelācija ar vēlēšanu rezultātiem, sāk zaudēt savu prognozēšanas spēku, tiklīdz mēs pārsniegsim aptuveni 4-5 mēnešus. Par laimi, tas joprojām dod kampaņām daudz laika, lai izstrādātu stratēģiju un pieņemtu lēmumus par to, kā sadalīt resursus.

Algoritmu izmantošana vēlēšanu prognozēšanai: tērzēšana ar zīmēto linzeru