[기자수첩] 여론조사가 틀리는 이유 ⑨

데이터 과학을 활용한 정치 활동의 고급화 움직임 빅데이터 여론 분석 대시보드와 수학 알고리즘의 활용 고급 여론조사 방법론 등장, 정치 수준 상승 가능할까?

케임브리지 애널리티카(Cambridge Analytica)의 2016년 미 대선 개입 사건 이후 정치권에서 데이터 과학을 이용하려는 움직임이 지속적으로 커지고 있다. 여론 조작이라는 비난을 받았던 ‘성향 타겟팅(Psychographic targeting)’이 데이터 과학에서 쓰는 수학적인 도구에 대한 상세 사항이라는 것이 알려지면서 ‘정치 활동의 고급화’라는 주장에 납득하는 분위기가 형성되고 있는 것이다.

이에 여의도 정가에서는 단순 여론 조사뿐만 아니라 빅데이터를 활용한 전문 분석을 통해 좀 더 정치 활동을 효율적으로 진행하려는 도전이 진행되고 있다. SK텔레콤에 따르면 2020년 총선에 시범적으로 더불어민주당 산하의 민주연구원에 자체 분석 서비스를 제공했고, 이어 2020년 하반기에는 서울시장 및 부산시장 재·보궐 선거 기간에는 국민의힘 산하의 여의도 연구원에도 유사한 서비스를 제공한 것으로 알려졌다. 지도상에 SK텔레콤 가입자들이 현재 어느 지점에 있는지 표시함으로써, 특정 시간대에 유권자들이 많이 몰리는 곳을 예측할 수 있는 시스템이었다.

데이터 과학 업계 관계자에 따르면 이미 유사 서비스를 포털 서비스 업체, 내비게이션 업체, 카드 업체 등에서 제공하고 있으며, 각각 실시간 사용자 위치뿐만 아니라 매출액 정보, 자동차 위치 정보 등과 연계한 서비스가 B2B 형태로 제공되고 있다.

중심성, 근접성은 Eigen-centrality 계산에 근거/출처=㈜파비 데이터 사이언스 연구소

빅데이터 기반 성향 타겟팅 서비스

업계에 따르면 구글의 검색 결과를 정리하는 시스템의 가장 기본 알고리즘은 페이지 랭크(PageRank, 검색 키워드와 연관성이 높은 웹페이지 순서)로, 해당 알고리즘의 가장 밑바닥에는 고유 중심성(Eigen Centrality) 계산법을 활용하고 있는 것으로 알려져 있다. 특정 키워드에 관련되는 웹페이지들을 네트워크 형태로 나열하고, 네트워크 안에서 가장 중심에 놓인 웹페이지 순서로 랭킹을 정하는 알고리즘이다. 이때 네트워크 내의 중심성을 계산하는 방식이 선형대수학의 고윳값(Eigenvalue) 및 고유벡터(Eigen-vector)를 계산하는 구조를 활용한다.

같은 알고리즘을 개개인에게 특화된 형태로 운영하는 것이 현재의 구글 검색 개인화 서비스이며, 유사한 계산법과 개인화 작업 절차가 페이스북, 인스타그램, 유튜브 등의 글로벌 최상위 클래스 업체들에서는 모두 이뤄지고 있다는 것이다. 다만 한국의 네이버, 다음카카오 등의 IT 업체들은 개인별 활동 정보를 수집, 처리하는 역량이 부족해 아직 서비스되지 않는 상태라고 한다.

빅데이터 여론 분석 전문기업 ㈜파비에 따르면 같은 수학 알고리즘을 바탕으로 빅데이터 기반 여론 분석 대시보드를 B2B 형태 서비스로 제공하고 있으며, 구글 검색 최상위 노출을 위해 연관 키워드를 고민하는 일부 마케팅 업체들에서 적극적인 호응을 얻고 있다고 알려졌다. 국내의 경우 네이버 검색 위주의 시장인 만큼 시장이 크지 않으나, 구글 검색 최상위를 노리는 일부 국내 기업 및 해외 고객들에게 적절한 연관 키워드를 고를 수 있는 정보가 된다는 것이다.

정치, 정책에 쓸 수 있는 방향은?

기업 관계자에 따르면 정책 발의에서도 여론의 동향을 단순 언급량 정도로 파악하는 것이 아니라 연관 키워드들이 어떤 묶음으로 소비되고 있는지, 희망하는 키워드들과 부정적인 키워드들이 얼마나 중심에 모여있는지를 이용해 여론을 좀 더 심도 깊이 판단할 수 있다고 주장했다.

이어 정치권에서도 케임브리지 애널리티카에서 시도했던 것처럼 개인화된 서비스에는 한계가 있으나, 후보 이름과 대통령, 서울시장 등 직위 간의 키워드 네트워크상의 거리, 그룹 배정, 함께 언급되는 키워드에 대한 선호도 등에 맞춰 선거 전략을 짤 수 있다고 전했다. 예를 들어 ‘서울시장’이라는 키워드와 해당 후보 간의 거리가 굉장히 멀고, 네트워크 내에서 ‘서울시장’과 연관된 키워드에 있는 키워드가 평소 기자 인터뷰 등에서 전혀 다루지 않았던 사안이라면, 그런 키워드에 맞춘 메시지를 적극적으로 내보내는 것이 여론의 주도권을 잡는 전략이 될 수 있다는 것이다.

과거의 여론조사는 단순히 유권자의 반응, 그것도 후보에 대한 선호·비선호만을 판단하는 수준이었다. 그러나 빅데이터 시대가 오면서 실제 유권자의 다양한 측면을 고려하는 복잡한 여론조사가 가능해졌고, 응답을 기다리는 수동성을 넘어, 거꾸로 유권자들의 선호를 추적하는 적극적인 여론 동향 분석이 가능해졌다.

여론조사는 틀렸지만, 완전히 틀리지는 않았다. 그저 좀 더 고급 여론조사 방법론이 등장하면서 새로운 형태의 정보성을 가진 조사가 된 것이다. 이제부터는 정치인들이 고급 여론조사를 얼마나 적극적으로 활용할 수 있느냐가 정치 수준을 끌어올릴 수 있는 또 하나의 도전장이 될 것이다. 페이스북 CEO를 불러놓고 “페이스북은 무슨 사업으로 매출액을 만들어내나요?” 같은 어리석은 질문만 종일 해대는 미국 상원의원과 같이 업계 관계자들에게 웃음거리가 되는 정치인이 아닌, 제대로 된 역량을 갖춘 정치인이 길러지기를 기대한다.

Similar Posts