제21대 총선은 코로나19 확산 속에 치러졌다. 특수한 상황으로 인해 2016년에 비해 선거 관련 보도가 줄지는 않았을까. 한국언론진흥재단 뉴스 분석 시스템인 빅카인즈(https://www.bigkinds.or.kr)1)를 통해 21대 총선 보도를 분석해봤다. 편집자 주
위기 상황에서도 정치를 멈출 순 없다. 정치는 국가 또는 정부를 운영 또는 통치하기 위해 인간이 벌이는 활동들을 일컫는데, 전염병 확산과 같은 위기 상황에서 정부 운영의 진가가 도드라지게 나타나기 마련이다. 그렇기 때문에 공동체의 안전을 위협하는 코로나19와 같은 긴박한 문제가 있는 상황이라 할지라도 국가의 현재와 미래에 큰 영향을 미치는 선거에 관심을 거둘 수는 없다.
하지만 이례적인 신종 전염병 확산 속에 치러지는 지난 제21대 국회의원 선거에 대한 걱정은 적지 않았다. 투표장 감염 우려로 투표율이 떨어질 것을 걱정한 목소리부터 관심이 온통 코로나19로 쏠린 가운데 ‘깜깜이 선거’가 될 거라는 걱정도 컸다. 더군다나 이번 선거는 준연동형 비례대표제라는 생소한 규칙에 따라 치러지는 첫 선거였다. 제1야당인 미래통합당이 비례용 위성정당을 만들고 여당인 더불어민주당까지 이 꼼수를 따라 하면서 혼란을 더한 상황이었다. 선거를 하루 앞둔 이 글의 집필 시점(4월 14일)에선 이미 발표된 역대 최고를 기록한 사전투표율(26.69%) 덕에 투표 참여 저조에 대한 우려는 다소 씻겼지만, 깜깜이 선거에 대한 우려는 여전하다. 이 글이 인쇄돼 읽히는 시점에서 선거 결과는 이미 판가름 낫겠지만, 과연 유권자가 선거에 대한 충분한 정보를 얻을 수 있는 상황에서 던진 투표였는지에 대한 궁금증은 여전할 터다.
‘코로나 시국’에 과연 언론은 총선에 충분한 관심을 쏟았을까. 뉴스는 시민이 선거를 비롯한 정치 활동의 정보를 얻는 가장 중요한 통로라 해도 과언이 아니다. 빅카인즈 시스템을 통해 이를 가늠해 보기로 하자.
총선 관련 뉴스, 전염병 이겼나
코로나19 여파로 유권자에게 후보 등에 대한 정보가 제대로 전달되지 않을 수 있다는 우려는 일상의 뉴스 경험을 떠올리면 충분히 할 법하다. 과거 비슷한 규모의 선거라면 투표일이 다가올수록 선거 관련 소식이 뉴스의 가장 중요한 비중을 차지하곤 했는데 이번 선거의 경우 한 달을 앞둔 상황에서도 전염병 관련 뉴스가 상위를 휩쓸었다. 빅카인즈의 ‘주간이슈 보기’를 통해 3월 15일 앞뒤의 10대 이슈 뉴스를 보면 1위는 물론이고 순위 범위의 다수 뉴스가 코로나19 또는 그 여파로 인한 내용(‘코스피 1,500선 붕괴’나 ‘초·중·고 개학 추가 연기’ 등)이다.
그렇다면 언론이 생산한 총선 관련 뉴스량은 어떨까. 신종 전염병 확산 중 치르는 초유의 선거에 관련 뉴스는 정말 줄었을까? 이를 확인하기 위해 수집일(4월 13일)로부터 석 달 전(1월 13일부터) 사이 생산된 총선 뉴스가 몇 건인지 빅카인즈를 통해 조사했다. 검색식은 ‘(국회의원 AND 선거) OR 총선’이다. 사전 검토를 해보니 ‘총선’ 키워드의 경우 별다른 추가 검색어가 없어도 해당 기간의 총선 관련 뉴스를 적절히 추출할 수 있다고 판단했다. 그러나 ‘선거’ 키워드의 경우 해외 다른 선거(예컨대 미국 대통령 선거)에 대한 뉴스까지 포함할 수 있어 ‘국회의원’이라는 조건을 함께 걸었다.
이렇게 검색된 기사 숫자를 지난 20대 총선의 경우와 비교했다. 20대 총선은 사전투표제가 처음 도입됐다는 점 정도를 빼면 이례적인 점이 그다지 없는 여느 선거 가운데 하나였다. 이변이 있는 선거와 없는 선거를 비교하고자 한 것이다. 20대 총선은 2016년 4월 13일에 치러졌는데, 올해와 같은 조건을 주기 위해 1월 11일~4월 11일 기간의 생산 뉴스량을 확인했다.
그런데 뉴스 생산량은 요일에 영향을 받는다. 주간에는 생산량이 많고 주말에는 적다. 만약 비교 대상 기간에 요일의 차이가 있으면(예컨대 한쪽은 주말이 더 포함된다든가 하면) 조건이 다르기 때문에 단순 비교를 해선 안 될 것이다. 다행히 총선은 매년 수요일에 치르게 돼 있으므로(공직선거법 34조), 양쪽의 요일 조건도 같았다. 또 동아일보, 조선일보, 중앙일보, 제민일보, OBS 등은 제외하고 나머지 49개 언론사만 검색 대상으로 했다. 이들 매체는 빅카인즈 데이터베이스에서 2016년 대상 기간 뉴스 누락이 있기 때문에 같은 조건을 만들기 위해 뺐다.
검색 결과, 21대 총선은 20대 총선보다 선거 관련 뉴스가 줄어든 것으로 나타났다. 20대 총선 시기 관련 뉴스는 6만 4,871건인데 반해 21대의 경우 6만 799건에 불과했다. 약 4,000개의 뉴스가 덜 생산된 것이다. 이 결과로는 올해 선거 관련 뉴스가 유권자에게 덜 제공됐고, 이는 코로나19 여파일 가능성으로 유추할 수 있다.
하지만 기사 수만으론 단정하기 이르다. 언론사의 기사 생산 숫자는 여러 변수에 의해 변동하기 마련이다. 예컨대 포털의 정책에 따라 어떤 시기 다수 언론사가 온라인용 기사를 더 생산한 경우도 있고, 어떤 시기엔 어떤 언론사가 24시간 속보 체제를 갖추면서 다른 시기에 비해 뉴스를 두드러지게 많이 생산하기도 했다. 즉, 어떤 이유에 의해서건 2020년 뉴스가 2016년에 비해 전체적으로 덜 생산됐을 가능성이 있는 것이다. 그 경우 코로나19 등과 상관없이 총선 관련 뉴스를 포함한 모든 기사 수가 줄었을 것이다.
이를 확인하기 위해 2020년과 2016년 해당 기간의 기사 총량을 조사했다. 각각 88만 8,649건과 100만 1,077건이었다. 실제 2020년 총량이 크게 줄어든 것이다. 총선 관련 뉴스를 총량으로 나눠준 비율을 비교하면 2020년은 6.84%, 2016년은 6.48%였다. 오히려 21대 총선에서 선거 관련 뉴스의 비중이 올라간 것이다. 이에 따르면 코로나19로 인해 선거 관련 뉴스가 줄었으리라는 추정은 그릇된 것으로 보인다.
보다 구체적으로 시기에 따른 양상도 살펴봤다. 앞서 언급했듯 기사 수는 요일에 따라 오르락내리락하는 패턴을 보이기 때문에 보기 편하게 주 단위로 나눴다. 결과는 [그림 1]과 같다.
[그림 1] 2016, 2020 총선 관련 기사 수 추이. X축의 날짜는 해당 주의 월요일. 2020년 총선 기준으로 2016년은 이틀 전임
비교를 위해 기사 총량 차이에 따른 보정을 해서 2020년 기사수를 조정했다. 그래프를 보면 투표일 3개월 전인 시작 시점에는 올해 기사량이 2016년을 크게 앞서다가 다음 주와 다음다음 주에 떨어지는데 이는 해당 기간에 설 연휴가 걸쳐 있었기 때문으로 보인다. 그 다음다음 주에는 2016년 기사량이 절반 이상 많이 감소하는데 역시 해당 주에 구정이 있어 거의 연휴였던 탓으로 풀이된다. 그 이후는 선거일이 가까워져 옴에 따라 비슷하게 증가하는 양상을 보인다. 그런데 가장 마지막 주에는 올해 기사량이 껑충 뛰어 지난 총선을 압도한다. 코로나19로 인해 선거 관련 뉴스가 적었으리라는 노파심에 선거일 직전 언론들이 총선 관련 뉴스를 과하게 생산한 것이 아닐까 싶을 정도다.
종합하면 기사량만을 놓고 보았을 때 코로나19 등에 묻혀 21대 총선 관련 뉴스가 제대로 다뤄지지 않았으리란 우려는 기우에 가깝다고 할 수 있다. 물론 여기엔 한계가 있다. 첫째, 선거 뉴스를 단순히 ‘국회의원 선거’ 또는 ‘총선’이란 키워드가 들어간 뉴스로 정의했기 때문에 내용을 더 들여다보면 빠졌어야 할 뉴스들이 포함되었을 수 있다. 즉 사실 코로나19에 관한 뉴스로 보아야 마땅하지만 ‘총선’이라는 단어가 한번 들어간 이유로 검색 결과에 포함되면서 총선 뉴스량을 부풀어 보이게 기여한 뉴스가 있을 수 있다는 점이다. 둘째, 생산자 측면의 분석이라는 점이다. 기자가 기사를 썼다고 해서 소비자에게 모두 잘 전달된다고 볼 순 없다. 총선 관련 뉴스가 많이 생산됐더라도 포털 등을 통한 유통 단계에서 대개의 기사가 코로나19 관련 기사 등에 묻히고 외면당했다면 여전히 올해 선거가 예전보다 깜깜이 선거에 더 가까웠을 가능성도 있다.
총선 관련 뉴스의 내용은
그렇다면 올해 총선 관련 뉴스의 내용은 어떠할까? 예전과 차이를 보이는 부분이 있을까. 빅카인즈를 통해 가늠해봤다. 우선 한눈에 들어오는 말구름(워드클라우드)을 비교해 봤다. 빅카인즈 검색 3단계의 ‘분석 결과 및 시각화’ 가운데 ‘연관어 분석’이다. 우선 올해에 ‘코로나19’가 큼지막하게 들어가 있는 점이 눈에 띈다. [그림 2] 당연한 결과겠다. 하지만 그것을 제외하면 두드러진 변화가 있다고 보긴 어렵다. ‘예비후보’, ‘유권자’ 등이 비중 있게 등장하고, 당시 여당이 제1야당보다 주요하게 나타나는 점 등이 둘 다 같다. 2016년 총선에서 안철수 열풍을 등에 업은 ‘국민의당’이 차지한 비중을 올해 ‘정의당’과 ‘민생당’ 등이 대신하고 있는 점, 2016년에 없는 ‘출판기념회 개최’와 ‘사전투표’ 등이 떠오른 점 정도가 차이다. 출판기념회를 선거 운동의 방편으로 쓰는 경향이 올해 더 심화한 탓으로 보인다.
[그림 2] 2020년 총선 관련 연관어 분석

[그림 3] 2016년 총선 관련 연관어 분석
한편 2016년 말구름에는 특이하게도 박근혜 전 대통령과 관련된 키워드가 없다. [그림 3] 국내 정치 특성상 총선은 대통령에 대한 중간평가 성격이 짙은 편이다. 올해 말구름에도 ‘문재인 정부’가 등장한다. 그런데 2016년 총선의 경우 ‘박근혜’, ‘대통령’ 등의 단어가 안 보이는 것이다. 당시는 세월호, 대북·일본 관계의 실정 등으로 박근혜 대통령에 대한 민심이 이반한 때인데 여당의 대통령과 거리 두기가 강하게 작동한 점이 반영된 듯 보인다.
빅카인즈의 말구름 분석은 검색 결과 가운데 관련성이 높은 뉴스 몇 개만 선정해서 그 뉴스텍스트 가운데 단어를 뽑는 특징이 있다. [그림 2]와 [그림 3]은 이 가운데 최대치인 1,000개 뉴스를 분석 대상으로 봤다. 그런데 이처럼 관련성과 상관없이 검색한 전체 뉴스에서 가장 많이 등장한 단어를 살펴보는 것도 성격을 파악하는 데 도움이 된다. 이를 위해 빅카인즈에서 검색한 뉴스 데이터를 내려받아 추가 분석을 했다. 이 경우 상위 단어 외에 분석자가 관심 있는 특정 단어가 어떤 빈도와 어떤 순위로 등장하는지 살펴볼 수 있다는 장점도 있다.
빅카인즈의 제공 데이터의 특징 가운데 하나는 ‘키워드’라는 항목이다. ‘키워드’는 빅카인즈 자체 알고리즘에 따라 뉴스 텍스트에서 명사를 등장 횟수와 순서에 따라 모두 추출해 담고 있는 항목이다. 즉 이 항목을 이용하면 분석자가 별도의 자연어 전처리 과정 없이 명사의 빈도 분석 등을 수행할 수 있다. 텍스트에서 명사를 효과적으로 추출하는 것은 신조어, 고유명사, 결합한 단어 등을 고려해야 하는 까다로운 과정인데 빅카인즈는 상당히 신뢰성 있는 명사 데이터를 제공한다.

이 항목을 이용해 올해와 2016년의 단어를 추출해 상위 20개를 뽑은 것이 [표], 말구름을 그린 것이 [그림 4], [그림 5]다. 빅카인즈의 키워드 단어에서 불용어(분석에 불필요한 단어)는 추가로 제거하는 과정을 거쳤다. ‘총선’, ‘국회의원’, ‘대표’ 등과 같이 주제와 겹치는 뻔한 단어, ‘이날’, ‘생각’, ‘논란’ 등과 같이 특정 의미를 담기보다 범용적으로 쓰이는 단어 등을 제외했다.
[그림 4] 2016년 상위 20개 최다 말구름
[그림 5] 2020년 상위 20개 최다 말구름
선거 당시 여당이 주요 단어로 등장하는 점은 빅카인즈의 말구름과 같다. ‘지역’, ‘공천’, ‘출마’ 등의 주요 단어도 올해와 2016년이 겹친다. 주목되는 부분은 단어의 빈도다. 2016년의 경우 ‘공약’이 3만 3,124회 등장하며 11위에 올라 있는데 올해의 경우 3만 364회로 18위에 머문다. 이는 올해 기사 가운데 후보자의 ‘공약’과 관련된 뉴스는 줄어들었을 가능성을 시사한다. 아주 큰 차이라고 할 수는 없지만 올해 선거 관련 뉴스는 비중이 올라갔음에도 불구하고 공약이라는 단어는 줄어든 것은 그만큼 총선 뉴스가 공약보다는 다른 요소들에 더 초점을 맞추고 있을 가능성을 보여 관심을 끄는 대목이다. 많은 정치 전문가와 중앙선거관리위원회 등에서 애를 쓰는 부분이 선거가 인물보다 정책 중심이 되도록 하는 것이다. 국내 선거의 경우 당면한 문제에 대한 후보자의 공약과 비전보다는 인물과 파벌 중심으로 흘러간 측면이 적지 않았다. 이 경우 후보자들은 정책 개발보다는 이미지 꾸미기와 헛공약 남발, 거물 정치인과 관계 맺기 등에 더 공을 들이기 마련이다.
또 다른 특징은 이번 선거의 경우 ‘비례’가 ‘지역구’를 압도하는 점이다. 2016년의 경우 ‘지역구’가 2만 7,704회로 14위에 올라 있고 ‘비례’는 1만 6,803회로 34위에 머물렀는데 올해는 ‘비례’가 역전해 34,031회로 16위에 오르고, ‘지역구’는 28,090회로 19위로 떨어졌다. 연동형 비례대표제의 첫 도입으로 달라진 비례대표에 대한 관심과 위상을 보여주는 것으로 풀이된다. 이밖에 ‘경제’의 경우 지난 총선에 3만 1,974회로 12위에 오른 반면, 올해 2만 5,847회로 20위로 떨어졌다. ‘정책’은 지난 선거 2만 3,162회, 올해 2만 5,430회로 순위는 모두 21위였다. 빈도 분석에 쓰인 불용어를 제거하기 전 총 단어의 개수는 2016년 총선 1,072만 482개, 올해 1,094만 3,283개로 기사 숫자는 차이가 컸는데도 총 단어의 개수는 별로 차이가 없었다.
1) 빅카인즈는 1990년 1월 1일부터 현재(2020년 4월 20일 기준)까지 54개 매체의 6,081만 2,303건의 기사를 수집 공개하고 있다.