빅데이터, 승리의 과학(2013) - newlife-js/Wiki GitHub Wiki
저자 : 고한석
출판사 : 이지스퍼블리싱
회사에서 제공하는 전자도서관에 있는 유일한 데이터분석 관련 서적이라 보게 되었다.
이 책은 2012년 오바마의 재선 당시에 빅데이터 기술을 사용해 재선에 성공한 비결을 담았다.
빅데이터 관련한 기술적인 설명보다는, 기본적인 개념만을 설명하였고,
선거에 활용한 빅데이터 전략 및 인물, 공화당의 전략과의 차이점 등을 주로 다루었다.
2012년 이전의 대선에서는 유권자 분석은 선거구별 선거위원회의 자료에 의존할 수밖에 없었고,
추가적인 자료를 얻기 위해서는 필드 리서치(인터뷰 등), 우편물, email 정도만 사용하였고,
유권자가 등록이 되어있지 않거나 이사를 갈 경우에는 제대로 된 홍보가 불가능하였다.
따라서, 선거구, 지역, 성별 정도의 정보만 가지고 타기팅 전략을 사용할 수밖에 없었는데,
스마트폰과 sns, 클라우드 기술 등이 발달하면서, 다양한 곳으로부터 다양한 방법으로 다양하고 많은 데이터를 수집할 수 있게 되었다.
오바마 캠프의 목적은, 유권자들을 더 세밀하게 분류하여 마이크로 타기팅을 하는 것이었다.
비용 대비 가장 큰 효과를 볼 수 있는 유권자층을 분류해내고, 유권자 개개인의 특성에 맞는 홍보문구나 공약 자료등을 제공하는 것이다.
오바마 캠프는 일찍부터 수많은 IT 전문가들을 영입하여 통합된 데이터베이스를 구축하고 수많은 수집 애플리케이션으로부터 데이터를 쌓는 통일된 API를 개발하였다.
그리고 데이터 수집 기업들로부터 데이터를 모아 들이고, 유권자의 인터넷 사용기록이나 페이스북 등의 sns 내 정보를 뽑아오는 애플리케이션을 개발하였다.
또한, 필드 리서치나 설문조사로부터 얻은 데이터를 실시간으로 전송하고 분석할 수 있도록 하였다.
이렇게 수집한 실시간의 빅데이터를 가지고 군집분석, 연관성분석, 텍스트마이닝, 감성분석 등을 활용하여 마이크로 타기팅을 할 수 있게 되었다.
또한, 이러한 전략의 효과성을 입증하기 위해, 여러 실험과 작은 선거들을 통해서 그 효과를 알고, 더 향상된 전략들을 개발할 수 있었다.
이 책을 보면서 놀라웠던 점은, 사용한 기술보다는.. 미국의 데이터 수집의 적법성...? 이었다.
아무리 자유로운 자본주의 국가라지만, 개개인의 데이터를 저렇게 쉽게 얻어서 활용할 수 있다는 것이 놀라웠다.
아마 우리나라였다면, 저렇게 수많은 개인 정보들을 데이터화하는 것이 힘들었을 것이다.\