블로그
2014년 05월 15일 10시 43분 KST | 업데이트됨 2014년 07월 15일 14시 12분 KST

컴퓨터와 인간의 대결 '얼굴인식능력'

아래, 위로 배열된 얼굴 짝을 비교해보자. 같은 사람일까, 다른 사람일까. 얼굴 인식 능력을 놓고 컴퓨터와 인간이 겨룬 결과가 나왔다. 결과는 컴퓨터의 승. 과거 숱한 도전에서 패배를 맛본 컴퓨터가 근소한 차이로 사람보다 뛰어난 얼굴 인식 능력을 과시했다.

<사진1> 아래, 위로 배열된 얼굴 짝을 비교해보자. 같은 사람일까, 다른 사람일까. 정답은 글 맨 아래에. arxiv.org

컴퓨터와 인간의 대결은 세인들의 흥미를 유발하는 이벤트이다. 그동안 체스, 퀴즈, 탁구 등에서 인간과 컴퓨터의 대결이 벌어졌다. 앞의 두 대결에선 컴퓨터가 이겼고, 올해 벌어진 로봇과 인간의 탁구 경기에선 인간이 이겼다. 하지만 컴퓨터가 인간과의 대결에서 승리를 거두기까지는 오랜 세월에 걸쳐 많은 시행착오를 거쳐야 했다. 이전의 대결처럼 한판 겨루기를 한 것은 아니지만, 이번엔 얼굴 인식 능력을 놓고 컴퓨터와 인간이 겨룬 결과가 나왔다. 결과는 컴퓨터의 승. 과거 숱한 도전에서 패배를 맛본 컴퓨터가 근소한 차이로 사람보다 뛰어난 얼굴 인식 능력을 과시했다.

화제의 주인공은 홍콩 중문대 정보공학부의 탕샤오어우 교수와 대학원생 루차오차오가 함깨 개발한 가우시안페이스(GaussianFace)란 이름의 알고리즘이다. 이들은 이런 알고리즘이 상용화할 경우, 스마트폰이나 컴퓨터 접속에서 보안, 출입국 심사에 이르는 다양한 분야에서 본인 여부를 확인하는 용도로 쓰일 수 있을 것으로 기대한다.

두 사람은 연구 결과를 최근 'arXiv'에 공개했다. 'arXiv'는 논문을 정식 출판하기에 앞서 인터넷을 통해 공유하는 논문 아카이브(archive)로, 미국 코넬대 도서관에서 지원하는 서비스다. 누구든지 자유롭게 논문을 올리고 내려받을 수 있는 온라인 논문 보관소로 세계 연구자들로부터 큰 인기를 얻고 있다. 주로 수학 물리학 천문학 컴퓨터과학 계량생물학 통계학 분야의 논문들이 올라온다.

어떤 얼굴 인식 프로그램이든 그 성능을 확인할 수 있으려면 알고리즘을 테스트할 적절한 얼굴 데이터가 필요하다. 물론 이 데이터에는 인종, 나이, 성뿐 아니라 조명, 표정, 자세별로 다른 다양한 얼굴들이 포함돼 있어야 한다. 거기에 헤어스타일, 의상 패션, 화장에 따른 얼굴 변화도 고려돼야 한다. 현재 이런 조건을 갖춘 표준 데이터 역할을 하는 것으로 LFW(Labelled Faces in the Wild)라는 이름의 데이터세트가 있다. 이 세트에는 웹에서 수집한 약 6000명의 유명인사의 얼굴사진 1만3천여장이 들어 있다.

그동안 개발된 알고리즘들이 보여준 얼굴인식 정확도. 맨위에 있는 것이 이번에 개발된 가우시안페이스다.arxiv.org

이 데이터세트에 들어 있는 두 개의 이미지를 비교해서 그들이 같은 사람인지 아닌지 판별하는 실험에서, 사람들이 보여준 정확도는 평균 97.53%였다. 그동안 개발된 숱한 컴퓨터 프로그램들은 이 수치를 넘어서지 못했다.

두 사람이 이번에 개발한 알고리즘이 처음으로 이 벽을 넘어섰다. 가우시안페이스는 각 얼굴을 150x120 픽셀 크기의 이미지로 규격화하고, 5개의 이미지 랜드마크(두 눈의 위치, 코, 입의 두 가장자리)에 기반해 얼굴을 변형시킨 뒤 각 이미지를 25x25 픽셀 조각으로 분할해 각 조각을 분석하는 방식으로 얼굴을 인식한다.

알고리즘을 개발했다고 끝나는 건 아니다. 실제 얼굴 데이터에 적용해가면서 반복적인 얼굴 인식 훈련을 받아야 한다. 우리도 얼굴과 그 사람을 일치시키려면 반복적으로 그 사람을 봐야 하듯이 말이다. 두 사람은 알고리즘의 인식 능력을 높이기 위해 표준 데이터인 LFW 말고도, 다른 4개의 데이터세트(Multi-PIE, MORPH, Web Images, Life Photos)에 대해서도 '가우시안페이스'를 적용해 이미지 비교 훈련을 시켰다.

훈련을 마친 '가우시안페이스'를 실제로 실험한 결과 보여준 정확도는 98.52%였다. 사상 처음으로 컴퓨터가 인간의 인식 능력을 뛰어넘은 순간이다. 비교 대상 사진들은 아주 다른 조건 아래서 촬영된 것들이어서 '가우시안페이스'가 보여준 정확도는 더욱 놀랍게 받아들여진다.

<사진2> 옆으로 짝을 이룬 얼굴들은 같은 사람일까, 다른 사람일까. 정답은 글 맨아래에. arxiv.org

 

하지만 연구팀은 컴퓨터가 인간을 뛰어넘은 이번 결과는 어디까지나 상징적인 것일 뿐이라고 말한다. 가우시안페이스는 주어진 데이터세트에 대해서만 능력을 발휘했을 뿐이다. 일반적인 조건 아래서 인간의 인식 능력을 따라잡을 수 있는 데까지 가려면 갈 길이 멀다는 것. 사람들은 단순히 얼굴 뿐 아니라 목이나 어깨선 같은 다른 단서를 활용할 줄도 안다. 또 컴퓨터 알고리즘을 훈련시키는 데 걸리는 시간이나 알고리즘이 얼굴 확인에 걸리는 시간 등 넘어야 할 산은 아직도 많다고 한다.

또 하나 간과해선 안될 문제가 있다. 기술 악용 또는 오용의 가능성이다. 범죄 수사에 활용할 경우, 무고한 사람이 단지 얼굴이 같다는 이유로 범죄 혐의자로 둔갑할 수도 있기 때문이다. 세상에는 비슷하게 생긴 사람이 얼마나 많은가. 현재 미 연방수사국(FBI)은 대규모 얼굴인식 데이터베이스 구축 작업을 벌이고 있다. 2015년까지 5200만명의 사진을 이미지화시키려는 계획이라고 한다. 미래의 어느날, 갑자기 경찰이 들이닥쳐, 컴퓨터가 당신의 얼굴을 범인 얼굴로 지목했으니 경찰서까지 동행할 것을 요구한다고 생각해보자. 난감한 건 둘째 치고 무고함을 증명하기 위해 경찰관한테 진땀을 빼며 설명해야 할 생각을 하면 머리카락이 쭈뼛해진다. 컴퓨터 기술이 초래할 수 있는 양면성이다.

*정답: <사진1>의 사진 짝은 같은 사람이고, <사진2>의 사진 짝은 서로 다른 사람이다. 가우시안페이스는 <사진1>과 <사진2> 모두 같은 사람들의 짝이라고 했다.