블로그
2016년 12월 30일 10시 36분 KST | 업데이트됨 2017년 12월 31일 14시 12분 KST

가짜 뉴스 차단하는 법

korea abortion

'프란치스코 교황 세계를 놀라게 하다... 도널드 트럼프 후보를 미국 대통령으로 지지'.

지난 7월 이런 제목으로 공개된 뉴스가 '제목만큼' 세계를 깜짝 놀라게 했다. 진원지는 'WTOE 5 뉴스'란 웹사이트. 이름만 보면 온라인 뉴스 서비스 같지만, 알고 보니 가짜 뉴스를 만들어 뿌리는 곳이었다. 이 거짓 정보는 순식간에 소셜미디어를 타고 퍼졌고 수십만 건의 공유를 기록했다. 미국 대통령선거에 미친 영향을 계량화할 순 없지만, 여론에 영향을 미쳤음은 부인하기 어렵다. 지난해 10월에는 '내셔널 리포트'란 웹사이트가 '프란치스코 교황이 버니 샌더스를 대통령으로 공개 지지했다'는 뉴스를 보도했다.

'가짜 뉴스 퇴치'는 미디어의 오랜 숙제다. 가짜 뉴스는 의도적으로 양산되기도 하지만, 팩트(사실)를 제대로 파악하지 못한 부주의에서 비롯되기도 한다. 그래서 '팩트체크'는 미디어의 기본 임무다. '팩트체크닷오아르지'나 '폴리티팩트'처럼 언론사가 대학과 협력해 사실검증팀을 운영하기도 한다. 구글과 미국 텍사스대학, 듀크대학, 스탠퍼드대학 연구진이 공동 개발한 '클레임버스터'는 인공지능 기반으로 문장을 자동 분석해 사실인지 아닌지를 구분해준다.

가짜 뉴스를 걸러낸 뒤에도 이미 퍼져나간 거짓 정보를 회수하기란 사실상 불가능하다. 그래서 사실 검증은 뉴스 작성 뒤가 아닌, 작성 이전과 작성 중에 작동해야 제 효력을 발휘한다. 그 과정에 정보기술이 도우미로 투입된다. 'FiB'는 미국 매사추세츠공과대학 재학생 나바니타 드, 큉린 첸, 마크 크래프트, 어난트 고엘이 함께 만든 프로그램이다. 이 프로그램은 요즘 뉴스 유통의 대세 '페이스북'을 겨냥했다.

웹브라우저 크롬의 확장기능 형태로 제공되는 FiB를 설치해보자. FiB는 페이스북에 올라오는 글, 이미지, 외부 링크를 서버로 전송해 신뢰 여부를 판별한 뒤 믿을 만한 정보는 '확인'(verified), 의심되는 정보는 '미확인'(not verified) 메시지를 띄운다. 사용자가 작성 중인 글에서도 미심쩍은 정보가 포함된 걸로 판단되면 FiB는 챗봇(대화형 로봇)으로 경고 메시지를 보낸다. FiB는 지난 11월 중순 미국 프린스턴대학에서 열린 해커톤(소프트웨어 개발 관련자들이 함께 작업하는 것)에서 '베스트 문샷'상을 받았다.

<로이터>는 지난 2년여 동안 개발한 '로이터 뉴스 추적기'(Reuter News Tracer)를 최근 공개했다. 이 시스템은 트위터 글(트윗)을 분석해 스팸을 걸러낸 뒤 비슷한 단어를 기반으로 트윗 묶음(클러스터)을 만든다. 묶음을 주제별로 분류하고 짧은 요약을 만든다. '테러'나 '폭발' 같은 단어가 들어가면 해당 묶음을 '테러 위험군' 식으로 잠재 분류한다. 트윗의 위치나 신원, 확산 방식과 정보 재확인 여부 등을 각각 점수화해 신뢰도를 높였다. <로이터>는 알고리즘을 기자처럼 생각하도록 훈련했다.

사람의 편견을 배제하는 것도 가짜 뉴스 양산을 차단하는 방법 중 하나다. 는 지난해부터 자연어처리 전문기업 '오토메이티드인사이트'와 손잡고 알고리즘을 속보 작성에 활용하고 있다. 프랑스 <르몽드>는 가짜로 의심되는 뉴스를 자동 표시해주는 웹브라우저 확장기능을 개발 중이다. 2017년 1월 첫선을 보일 예정이다.

페이스북도 가짜 뉴스 걸러내기에 골몰하고 있다. 올해 미국 대통령선거에서 가짜 뉴스에 화들짝 덴 페이스북은 인공지능을 소방수로 투입할 심산이다. 페이스북은 특정 단어를 미리 입력해 가짜 뉴스나 폭력적 동영상을 걸러낼 계획이다. 다만, 페이스북은 자칫 검열 이슈에 부딪힐까봐 신중하게 접근하는 것으로 알려졌다. 구글은 11월 중순, 가짜 뉴스를 유통하는 웹사이트를 자사 광고 네트워크에서 삭제하겠다고 발표했다.

* 이 글은 한겨레21에 게재된 글입니다.