데이터 자본주의, 데이터 거버넌스

어느 날 서울 시내에서 카카오택시를 불렀다. 잠시 후 내 앞에 7300만원짜리 영국 자동차 '재규어'가 도착했다. 영국 신사처럼 차려입은 기사의 친절한 설명. 카카오택시와 재규어가 진행하는 자동차 홍보 행사에 당첨됐단다. 이 행사를 위해 서울에 재규어 10대가 투입됐다.

문득 궁금했다. 택시를 부르는 수많은 사람 중 내가 선택될 가능성이 매우 낮을 텐데? 그러고 보니 그들에게 내가 제공한 정보가 있다. 그 자동차에 관심 있을 만한 사람을 추려낼 수도 있겠다. 아니나 다를까 영국 신사가 털어놓는다. "카카오택시 이용자 중 나이 등을 통해 대상자를 좁힌다"고.

내가 택시를 언제 어디서 타고 어디로 가는지 가장 많이 아는 곳은? 카카오택시다. 내 근무지가 어디고 주로 이동하는 경로가 어딘지, 택시 이용에 돈을 얼마나 쓰는지 알 수 있다. 그러니 대략 내가 무슨 일을 하고 경제 형편이 어떤지 추측할 것이다.

페이스북은 최근 메신저 서비스 '와츠앱'을 인수했다. 페이스북의 기존 친구관계 정보와 합치면 독점력을 행사할지도 모른다. 페이스북 로고가 영사된 벽에 스마트폰 사용자들이 투영된 모습. REUTERS

1조원 데이터의 가치

최근 내가 무엇에 관심 있는지 가장 많이 아는 곳은? 구글이다. 전자우편을 사용하려고 무심결에 로그인해 이곳저곳 검색하면 관련 광고가 계속 화면에 뜬다. 내가 어떤 정치적 성향이고 어떤 유형의 사람을 좋아하는지 가장 많이 아는 이는 페이스북이다. 같은 이치로 내가 가장 좋아하는 노래와 영화를 가장 잘 아는 곳은 유튜브라고 결론 내릴 수 있다. 그들은 어쩌면 나도 모르는 내 모습을 알고 있을지 모른다.

'빅데이터'의 시대다. 새로운 시대에 데이터는 기회이면서 동시에 문제가 된다. 카카오, 구글, 페이스북 등에 데이터는 금광이다. 데이터 수집 모델을 만들고 분석 기술을 익히는 데 앞선 기업은 천하를 자기 것으로 만들 수 있다. 실로 엄청난 기회다.

하지만 데이터를 내주는 소비자는 뜻하지 않은 문제에 맞닥뜨린다. 개인은 모든 곳에서 데이터를 생산한다. 화장실 변기 센서에서, 냉장고에서, 지도를 검색하고, 택시와 버스를 타고, 자동차를 몰면서도 다양한 데이터를 생산해낸다. 이 모든 정보는 사물인터넷으로 연결된 기기로부터 중앙에 전달된다.

이렇게 만들어진 개인정보를 잘 수집하고 이용해 번 돈으로 기업들의 주머니가 두둑해진다. 그런데 그 정보가 나를 통제하는 데 이용된다면? 내가 생산한 데이터로 돈과 권력이 만들어졌지만, 그들이 내 몫이나 권리를 챙겨주지 않는다면? 빅데이터 시대엔 이 문제를 효과적으로 해결하면서 기회도 놓치지 않는 방법을 생각해내야 한다.

최근에야 빅데이터의 중요성이 부각되는 것 같지만 오래전부터 데이터의 힘을 알고 활용한 이들이 있었다. 2015년 1월, 미국 최대 카지노 회사인 시저스엔터테인먼트(옛 하라스엔터테인먼트)가 파산 후 기업회생을 신청했다. 이 회사엔 엎친 데 덮친 격으로 자금세탁 혐의까지 씌워졌다. 그런데 기업회생 과정에서 시저스의 데이터 가치가 다시 부각됐다. 17년 동안 충성고객 서비스를 통해 모은 고객 행동 유형 데이터가 1조원 이상의 가치를 지닌 자산으로 인정됐기 때문이다.

시저스가 고객정보를 모으던 초기인 2004년 나는 그들의 전략을 직접 들을 기회가 있었다. 미국 매사추세츠공과대학(MIT)에서 경제학 박사학위를 받은 뒤 하버드 경영대학원 교수를 지내다 시저스의 최고경영자로 변신한 게리 러브먼이 내가 유학하던 학교를 찾아왔다. 특강을 통해 그들이 실험 중인 고객관계 관리 프로그램을 열심히 설명했다.

세종과 러브먼의 차이

러브먼은 가장 먼저 고객의 모든 개인정보가 담긴 카드를 전체 이용자에게 만들어줬다. 여기엔 한명 한명이 각각 어떤 게임을 하고 얼마를 쓰는지 기록된다. 기록에 따라 맞춤형 쿠폰과 서비스가 제공된다. 예를 들어 한 사람이 슬롯머신에서 10분 연속 돈을 잃으면 카지노 담당 직원이 찾아가 말을 걸어 기분을 풀어준다. 돈을 많이 잃었다면 블랙잭을 할 수 있는 20달러 무료 쿠폰이 인쇄돼 나온다. 이에 대한 고객 반응은 하나하나 새 전략의 자산이 됐다. 시저스에서 고객 충성도를 높이려는 마케팅은 철저히 데이터 과학을 통해 이뤄진 셈이다. 17년 동안 차곡차곡 데이터가 쌓였고 1조원 넘는 자산이 된 것이다.

우리 역사에도 데이터의 힘을 믿는 사람이 있었다. 바로 조선의 왕 세종이다. 측우기가 개발된 이듬해인 1442년 세종은 전국에 관측망을 구축했다. 서울의 궁궐과 관상감 등 4곳과, 전국 8도 감영과 부·군·현 346곳을 더해 모두 350곳에 측우기를 보급하고 관측망을 구축했다. 세계 최초로 밀도 높고 정량적인 데이터를 생산하는 기상관측망을 만든 것이다.

세종은 왜 관측망을 만들었을까? 징세와 구휼 때문에 기본 데이터를 수집하기 위해서라는 합리적 추론이 가능하다. 당시 조정에서는 각 지역의 농사 소출이 얼마인지 추정할 근거가 없었다. 따라서 각 지방 관아의 보고가 정확한지 판단하기 어려웠고 세금을 정확하게 걷기 어려웠을 것이다. 또한 어디에 가뭄이 왔고 얼마나 심각한지 판단하기 어려웠을 것이다. 전국 강우량 관측망을 통해 데이터를 수집하면 풍년이 든 곳에서 세금을 더 거둬 흉년인 곳에 분배하는 구휼 정책이 가능하다는 데 세종의 생각이 미쳤을 것이다. 이 정도의 정책 효과를 거둔다면 전국에 강우량 관측망을 구축하는 과감한 투자도 할 수 있다.

게리 러브먼에게 고객 데이터는 자본이었다. 고객 움직임을 기록한 데이터에 돈줄이 있었다. 세종에게 강우량 데이터는 권력이었다. 강우량 데이터에 과세 전략과 구휼 정책이 있었다. 러브먼은 데이터를 활용해 더 많은 사람에게 도박을 권하고 파산을 늘려 이익을 챙겼을 것이다. 반면 세종은 더 많은 사람에게 생존 근거를 제공하고 조세정의를 실천했다. 데이터는 칼과 같다. 데이터는 자본이나 권력을 위해 쓸 수 있고, 사람을 살리는 데 사용될 수 있다. 그 칼을 어떻게 사용할지 선택하는 것은 인간이다.

데이터 거인에 맞서는 데이터협동조합

4차 산업혁명이나 인공지능도 인간이 생산하는 데이터가 만든다. 영화 <조작된 도시>의 한 장면. 티피에스컴퍼니 제공

빅데이터 시대엔 그 칼이 훨씬 커졌다. 이제 데이터는 칼이라기보다 석유에 가깝다. 데이터 없이 웬만한 산업은 존재하기 어렵다. 데이터를 충분히 확보하고 독점하는 사람은 초과이윤과 무한권력을 가질 수 있다. 이 시대는 우리를 어떤 세상으로 이끌까. 이미 두 가지 명백한 문제가 떠오르고 있다. '독점'과 '개인정보'의 문제다.

독점 문제를 보자. 구글과 페이스북은 데이터 거인이 됐다. 방대한 개인정보 데이터를 기반으로 인공지능 시대의 독점적 강자로 떠올랐다. 인공지능을 개발하는 데는 분석 대상 데이터를 가진 기업이 유리하다. 진입장벽을 높게 치고 그들만의 인공지능 시장에 아무도 못 들어오게 만드는 일이 쉬워졌다.

하지만 전통적 경쟁 촉진 정책으로 이걸 무너뜨릴 수 없다. 일단 시장에서는 문제가 해결되지 않는다. 시장에서 데이터는 자유롭게 거래되기 어렵다. 한건 한건의 가치를 평가하기 어렵고, 많은 양이 모여야 가치가 생긴다. 그렇기 때문에 소비자는 개인정보를 쉽게 기업에 넘겨준다. 그 대가로 공짜 서비스 조금만 받으면 만족한다. 정보 한 단위의 가치가 너무 낮기 때문이다. 데이터 독점을 실제 독점으로 인식하고 규제하려 해도 문제가 생긴다. 독점은 시장점유율을 기준으로 판단한다. 데이터를 압도적으로 많이 보유해도 정책 당국이 이를 독점으로 간주하기 어렵다.

얼마 전 페이스북은 메신저 서비스 '와츠앱'을 인수했다. 미국과 유럽에서 상당한 인기를 끄는 와츠앱은 방대한 규모의 친구관계 정보가 있다. 페이스북의 기존 친구관계 정보와 합치면 독점력을 행사할지도 모른다. 하지만 미국과 유럽의 공정거래 정책 당국은 이 인수·합병을 막지 않았다. '친구관계 정보 보유'에 독점 개념을 적용하지 않은 것이다.

또한 데이터 양이 절대적으로 중요한 사업의 속성상 잠재 고객이 많은 미국과 중국 기업이 절대적으로 유리하다. 이들 국가를 중심으로 개인정보 데이터 독점기업이 자라나 전세계를 지배할 가능성이 높다. 데이터 독점기업들은 두 나라의 규제만 받는다. 전세계를 놓고 보면 미국과 중국의 독점이기도 하다.

독점에 대한 해법은 몇 갈래로 생각해볼 수 있다. 정부의 데이터는 최대한 공개하는 것이 출발점이다. 특히 분석할 수 있는 형태로 표준화해 공개하는 것이 중요하다. 민간기업 데이터의 개방을 의무화하는 것도 방법이다. 기왕 생산돼 보유하는 데이터라면 특정 기업이 독점 소유하는 대신 누구라도 가져가 사업에 사용하도록 허락해주는 제도를 도입하는 것이다. 물론 익명화 등의 과정은 필수적이다.

데이터 생산 개인들이 '데이터협동조합'을 만들어 데이터를 자산화해 독점기업과 협상력을 갖는 것도 방법이다. 인수·합병 등 공정거래 정책에서 데이터 자산을 감안하도록 제도화하는 일도 필요하다.

개인정보 문제는 '개인의 활동 정보는 누구의 것인가'라는 데이터 소유권 문제로 요약된다. 어떤 사람이 어디에서 무엇을 타고 어디로 이동했다는 정보가 만들어지면, 정보소유권은 지속적으로 그 사람에게 귀속돼야 옳다는 주장이 나온다. 이렇게 되면 '정보 수집 동의' 상자에 체크하는 것만으로 모든 사용권을 넘겨주는 지금 시스템은 불합리하다. 정보 수집 기업이 데이터를 영리 목적으로 사용할 때마다 별도 동의를 받도록 제도가 바뀌어야 한다.

데이터 수익을 분배하라

만일 동의를 모두 받기 어려우면, 데이터 이용으로 수입이 생겼을 때 분배라도 해줘야 한다는 논리가 가능하다. 마이크로소프트리서치의 이코노미스트 글렌 웨일은 '데이터는 노동'이라는 논리까지 확장한다. 4차 산업혁명도 인공지능도 알고리즘이 만들어낸다기보다 인간이 생산하는 데이터가 만드는 것이라는 이야기다. '인간은 존재만으로도 가치 있다'는 기본소득제의 명제와도 관련이 깊다. 이런 철학 아래 정책 대안을 찾다보면 결국 데이터 생산자의 배당제도로 귀결될 가능성이 높은 주장이기 때문이다.

데이터의 주인은 원래 사람이라는 가치를 잊지 말아야 한다. 데이터를 잘 활용하는 기업과 기술을 빠르게 키워두는 게 나라 경제에 도움이 되리라는 점도 분명하다. 두 원칙이 어우러지는 솔루션을 만드는 일은 그리 머지않은 미래에 중요한 사회 의제가 될 것이다. 데이터의 주인인 개인에게 최대한 권리를 주면서도 데이터 이용 기업에는 최대한 개방적인 데이터 거버넌스를 더 깊이 고민해야 한다.

* 이 글은 한겨레21에 게재된 글입니다.

이 기사를 공유합니다

상단영역

본문영역

데이터 자본주의, 데이터 거버넌스

본문영역

연관 검색어 클릭하면 연관된 모든 기사를 볼 수 있습니다