데이터베이스 알고리즘을 사용하여 선거 예측 : drew linzer와의 대화

알고리즘을 사용하여 선거 예측 : drew linzer와의 대화

Anonim

Drew는 1 월 30 일과 31 일 라스 베이거스에서 열린 Big Data Innovation Summit에서 발표 할 예정입니다. http://analytics.theiegroup.com/bigdata-lasvegas는 미국 오바마, Best Buy, LinkedIn, New York Times, Nokia, Bitly, Barnes & Nobles, Walmart Labs 등이 있습니다.


등록 링크 : http://bit.ly/Zs3wms


이 인터뷰는 George Hill이 진행했으며 Big Data Innovation Magazine에 발표되었습니다.


당신의 예측에 어떤 반응이 있었습니까?


대부분의 반응은 여론 조사를 연구 한 사람들과 인기있는 전문가와 의견가의 "장감"예측 간의 정확도 차이에 중점을 두었습니다. 선거 당일, 나와 같은 데이터 분석가, Nate Silver (New York Times FiveThirtyEight 블로그), Simon Jackman (Stanford University 및 Huffington Post) 및 Sam Wang (Princeton Election Consortium)은 모두 오바마의 재선 가능성을 90 % 이상으로 올렸습니다. 가장 가능성있는 결과로 오바마에 대한 332 개의 선거 투표. 한편 칼 로브 (Karl Rove), 조지 윌 (George Will), 스티브 포브스 (Steve Forbes)와 같은 전문가들은 롬니가 이길 것이라고 말했다. 이로 인해 나는 미래의 선거에 나아갈 희망이있는“수당의 승리”에 대해 이야기하게되었습니다.


예측에 사용 된 알고리즘을 어떻게 평가합니까?


내 예측 모델은 캠페인의 매일 6 월부터 주 투표 결과와 최종 선거 투표를 추정했습니다. 나는 이러한 예측에 대한 평가가 가능한 한 공정하고 객관적이기를 원했습니다. 따라서 선거 약 한 달 전에 웹 사이트에 결과가 알려진 후에 사용할 8 가지 평가 기준을 게시했습니다. 결과적으로 모델은 완벽하게 작동했습니다. 올 여름 오바마 대통령은 인디애나와 노스 캐롤라이나를 제외한 모든 2008 년 주에서 승리 할 것이라고 예측했으며, 9 월 오바마에 대한지지가 높아진 이후에도 그 예측에서 거의 싹이 나지 않았다.


독립 분석가와 캠페인 팀이이 캠페인 전체에서 사용한 데이터의 양은 엄청났습니다. 2016 년 데이터 사용에 어떤 영향을 미칩니 까?


2012 년 캠페인은 다양한 양적 정보원이 관리되고, 신뢰할 수 있으며, 다양한 목적으로 성공적으로 적용될 수 있음을 증명했습니다. 우리 외부인들은 선거 결과를 훨씬 미리 예측할 수있었습니다. 캠페인 내에서 유권자 타겟팅, 의견 추적, 기금 모금 및 유권자 투표율에있어 큰 진전이있었습니다. 이제 우리는이 방법들이 효과가 있다는 것을 알았으므로, 되돌아 갈 생각은 없습니다. 저는 2016 년 기자와 캠페인 해설자들이 설문 조사 집계를 훨씬 더 심각하게 받아 들일 것으로 기대합니다. 그리고 오바마와 민주당은 현재 캠페인 기술에 유리한 것으로 보이지만 공화당이 빨리 따라 붙지 않으면 놀랄 것입니다.


이 데이터 중심 캠페인의 성공으로 인해 캠페인 관리자는 이제 전략가이자 분석가가되어야한다고 생각하십니까?


캠페인 관리자는 분석가가 될 필요는 없지만 데이터와 기술을 어떻게 활용할 수 있는지에 대해 더 깊이 감사해야합니다. 캠페인은 항상 설문 조사 연구를 사용하여 전략을 세우고 유권자 감정을 측정했습니다. 그러나 이제는 소셜 네트워킹 웹 사이트, 유권자 데이터베이스, 모바일 스마트 폰 및 이메일 마케팅과 같은 다양한 강력한 도구를 사용할 수 있습니다. 그리고 그것은 최근 폴링 방법론과 통계적 의견 모델링의 발전에 추가됩니다. 현재 미국의 캠페인 정치에서 많은 혁신이 일어나고 있습니다.


6 개월 전에 선거 결과를 예측할 수있었습니다. 분석 기술을 사용하여 결과를 정확하게 예측하기위한 현실적인 최대 기간은 얼마라고 생각하십니까?


과학이 우리가 지금 당장 나아갈 수있는 한 4 ~ 5 개월 정도가 걸렸습니다. 그리고 그것은 심지어 그것을 조금 밀고 있습니다. 그 전에는 여론 조사 결과가 최종 결과에 대해 충분히 정보를 제공하지 못했다. 너무 많은 사람들이 미정이거나 캠페인에주의를 기울이지 않았다. 선거 결과와 관련이있는 역사적 경제적, 정치적 요인들도 대략 4-5 개월 범위를 넘어 서면 예측력을 잃기 시작합니다. 다행히도 캠페인에 전략을 세우고 리소스를 할당하는 방법에 대한 결정을 내릴 시간이 충분합니다.

알고리즘을 사용하여 선거 예측 : drew linzer와의 대화