한국 총선, 영국 브렉시트, 미국 대선... 2016년은 여론조사 '재앙의 해'
여론조사 '종말론'까지 거론... 정확성과 신뢰도 높이는 길밖에 없다

신창운 덕성여대초빙교수

2016년은 여론조사 역사에서 길이 기억되어야 한다. 재앙의 해로 말이다.

4월 한국 국회의원 선거, 6월 영국 브렉시트 찬반, 11월 미국 대통령 선거에 이르기까지 연이어 참패를 기록했다. 전통적인 여론조사 방식에 더 이상 기대할 게 없다는 얘기까지 나오는 건 각국의 예측 실패가 처음이 아닌 까닭이다. 한국은 지난 2010년 서울시장 선거를 비롯해 16개 광역단체장 선거에서 엄청난 실패를 맛봤다. 영국 역시 1992년 총선 때 소위 ‘수줍은 보수당 지지자(Shy Tory) 효과' 탓에 보수당 집권을 예측하지 못했다.

무엇이 문제인가. 왜 예측 실패를 반복하는가. 가장 먼저 ‘표본추출(Sampling)’이 언급되어야 한다. 인터넷, 스마트폰, SNS 등 새로운 IT기술 발달과 그 영향에 따른 조사 환경 악화로 인해 표본의 대표성 확보가 매우 어려워졌다.

퓨리서치센터 조사에 따르면, 최근 10년 사이 응답자를 직접 혹은 전화로 만나는 것(접촉률)에서부터, 협조를 얻어내고(협조율), 응답을 받아내는 비율(응답률)이 급격히 낮아졌다. 그 결과 응답자와 비응답자의 정치적 성향 차이에 따른 편향이 불가피하고, 결국 응답자에 기반한 여론조사로 비응답자를 포함한 실제 투표 결과를 예측하는 일이 어려워졌다.

낮은 응답률 외에 다른 문제도 있다. 응답자 중에서 ‘제대로’ 답하지 않는 사람들이 있다. 지지 여부에 대한 여론조사 응답과 실제 투표소에서 찍는 후보를 달리 하는 유권자가 있다는 말이다.

일부 학자들이 지적했듯이 투표율 예측 불발과 조사 거절로 인해 ‘수줍은’ 혹은 ‘회피하는’ 보수정당 지지자 효과가 발생하는 건 흔한 일이다. 바람직한 방향으로 응답하려는 경향을 뜻하는 '사회적 요망(Social Desirability) 효과', 자신의 의견이 소수일 경우 그것을 숨기고자 하는 '침묵의 나선(Spiral of Silence)' 등이 이와 관련된 이론이다.

오차범위가 포함된 여론조사의 숙명 탓도 있다. 표본을 대상으로 한 여론조사는 하나의 수치가 아니라 범위로 예측하게끔 되어 있다. 가령, 클린턴 51%, 트럼프 49%로 나왔을 경우 오차범위가 ±3%포인트라면 실제 투표 결과는 클린턴 48~54%, 트럼프 46~52% 사이라는 얘기다. 따라서 예측치와 달리 클린턴 48%, 트럼프 52%로 역전할 수도 있으며, 이 경우 여론조사 예측 실패가 아니다. 이런 까닭에 이번 미국 대선처럼 51개 주를 대상으로 하거나 지난 4월 한국 총선처럼 250여개 지역을 대상으로 동시에 선거가 실시될 경우 박빙 지역 수에 따라 예상과 다른 판세가 나올 수 있다.

미국은 선거 여론조사의 마지막 보루였다. 수많은 연구와 풍부한 예측 경험을 토대로 한국이나 영국 등 다른 국가에 비해 선전해 왔다. 대선 여론조사 예측에서도 1948년 이래 한 번도 실패한 적이 없다.

그래서 많은 전문가들이 트럼프의 대통령 당선만큼이나 커다란 충격에 휩싸여 있다. 언론을 비롯한 학계와 업계 일부가 여론조사 ‘무용론’을 넘어 ‘종말론’을 거론하는 것도 이 때문이다.

그러나 여론조사 무용론은 성급하다. 미국은 매우 독특한 대선 시스템을 갖고 있다. 여론조사 측면에서 봤을 때 겉으론 대선이지만, 실제론 총선을 치른 거나 다름없다. 특정 주에서 한 표라도 더 얻은 후보가 선거인단을 독식하기 때문에 소선거구제 하의 한국 총선과 비슷한 셈이다. 박빙 주별 승부에 따라 전국 지지율과 상반된 결과가 나올 수 있다. 실제로 클린턴(47.8%)과 트럼프(46.6%)의 최종 지지율은 각종 여론조사와 거의 일치했다. 만약 한국 선거방식으로 미국 대선을 실시했더라면, 클린턴이 당선됐고 여론조사도 틀리지 않았다는 얘기다.

결국 두 가지 방향으로 가야 한다. 전통적인 확률적 여론조사의 중요성은 꾸준히 강조되어야 한다. 시간과 비용을 더 들이더라도 일정 수준으로 응답률을 끌어올려 정확성과 신뢰도를 높여야 한다.

휴대폰 등을 결합한 ‘이중 표집틀’ 활용, 여론조사 총합(Aggregation) 혹은 결합법(Hybrid Approach) 등도 적극 모색해야 한다. 대안적 여론조사, 즉 최근 기대를 모으고 있는 인터넷과 모바일, 인공지능(AI) 및 빅데이터 등은 전통적 방식과 상호보완적으로 활용되어야 한다. 대개 비확률적으로 표본을 선정하는 이들 방식은 예측 정확성보다 편의성과 시의성 등에 초점이 주어져 있다.

지난 4월 한국 총선 여론조사 예측 실패 이후 “이대로면 2017년 대선 때 여론조사 결과는 쓰레기”라는 보도가 있었다. 틀릴 텐데 왜 그런 여론조사를 하느냐는 거다. 심정적으로 이해하지만, 총선과 대선 여론조사는 서로 다르다. 총선 실패로 대선을, 거꾸로 대선 성공으로 총선 여론조사를 판단하는 건 잘못이다.

여론조사라고 다 같은 게 아니다. 함부로 발로 차선 곤란하다. 만약 2017년 한국 대선 여론조사 예측 성공/실패 여부에 대해 내기를 해야 한다면, 성공 쪽으로 베팅한다.

◇필자 약력

▲부산대 사회학 박사 ▲한국갤럽조사연구소 사회조사부 연구원(1988~1991) ▲포스코경영연구소 경영컨설팅본부 연구위원(1991~2003) ▲중앙일보 여론조사 전문기자(2003~2014) ▲덕성여대 사회학과 초빙교수(2015~)

저작권자 © 법률방송 무단전재 및 재배포 금지