뉴스
2018년 09월 19일 18시 32분 KST | 업데이트됨 2018년 09월 20일 12시 09분 KST

최진기의 통계청 비판이 잘못된 이유를 최대한 쉽게 설명해봤다

유튜브 채널 오마이스쿨의 강사 최진기 씨가 지난 9월 10일 ‘통계청 가계동향조사, 무엇이 문제인가?‘라는 내용의 영상을 공개했다. 6만명이 조금 넘게 시청한 해당 영상을 보고 통계청이 ‘해명 자료’를 냈다. 언론사가 아닌 개인 유튜브 채널을 상대로 청이 해명자료를 내는 일은 극히 드물다. 

그러나 해당 영상을 보면 통계청이 왜 이런 해명 자료를 왜 냈는지를 알 수 있다.

최진기 씨가 문제로 삼은 것은 아래 그래프다. 통계청이 발표한 아래 가계동향조사 그래프를 보면 2018년 2/4분기에는 적게 버는 사람(5분위)의 소득이 크게 낮아지고 많이 버는 사람의 소득은 많이 증가한 것으로 보인다.

http://kostatgokr

최진기 씨는 이 데이터를 설명하며 ”이 통계조사는 작년 표본보다 올해 표본에 가난한 사람들을 더 많이 뽑았다”라며 ”국가기관이 그걸 발표했다. 쪽팔린다”고 밝혔다.

″가난한 사람을 뽑았다”는 그의 말에는 어폐가 있다. 통계청이 가계동향조사의 표본을 추출하는 과정에서 ”가난하십니까?”라고 물어보는 게 아니다. 통계청은 주택 유형, 점유 형태, 가구원수 등을 참고해서 조사 시점의 모집단을 대표할 수 있는 표본을 설계한다. 

당연한 얘기지만 통계청이 전체 가구의 소득을 알고 있는 것도 아니라(알고 있다면 뭐하러 조사를 하겠는가?) ”사전적으로 가난한 가구를 미리 알고 추출하는 것은 불가능”하다. 단순하게 얘기하면 원인과 결과를 헷갈린 셈이다. 

Youtube/0hmyschool

이번 통계청 자료의 표본에 몇가지 결함이 있는 것은 사실이다. 2016년 1분기에 7000여개이던 표본이 2017년 1분기에는 4000여개로 크게 줄었고, 2018년 1분기에는 6600여개로 다시 증가했다. 3개년에 공통적으로 존재하는 표본은 약 1600개 밖에 되지 않는다.

이우진 고려대학교 경제학과 교수는 경향신문에 기고한 글에서 ”이렇게 표본수와 표본구성에 큰 차이가 나면 당연히 연도 간 비교라는 게 크게 의미가 없는 것인데 통계청에서 단순비교를 공표하면서, 그리고 그 비교를 일부 언론과 정치권에서 아전인수격으로 확대 해석하면서 사달이 난 것”이라고 밝힌 바 있다. 이런 비판은 온당하다. 

그러나 통계청의 입장도 온당하다. 횡단면 조사에서의 대표성은 2017년에 조사한 표본을 2018년에도 그대로 조사했느냐로 확보되는 것 만은 아니다. 해당 연도의 표본이 그해 인구·가구 구성지표를 얼마나 잘 대표하도록 설계했느냐로 판단할 수 있다.

한국갤럽의 여론 조사를 생각해보면 편할 것이다. 한국갤럽의 대선 후보 지지율 조사 등이 항상 전화 거는 사람을 정해 두고 여론 조사를 하는 건 아니다. 그럼에도 누구도 그 시계열성에 딴지를 걸지 않는다. 연령과 거주 지역 등이 유권자 모집단을 대표하도록 설계했기 때문에 시계열 분석 자료로 봐도 무방하다고 본다. 

Youtube/0hmyschool

표본은 전체 가계를 다 조사할 수 없어 가계 지표의 다양한 특징을 바탕으로 그 대표를 뽑는 과정이다. 이 샘플을 확정하는 데는 모집단 계층의 비율을 맞춰주는 게 중요하다. 예를 들어 1인가구 비중이 28.6%(통계청 인구조사)이면 샘플에서도 대략 이정도의 비율을 맟줘 주어야 한다. 

그런 의미에서 최 씨의 발언은 이 교수의 비판과는 달리 무책임하고 선동적이다. 그는 “30세 미만의 1인 가구는 84.5%가 새로운 표본”이라며 ”변명의 여지가 없다. 발표를 하지 말았어야 한다. 국민을 알기는 뭐로 아는 거야”라고 말한다.

30대 미만 1인 가구에 새로운 표본이 많다고 그 신뢰성이 떨어지는 것은 아니다. 새로운 표본과 과거 표본의 비율을 비교하는 게 더 중요하다. 20~30대 1~2인 가구의 비중은 유지표본 내 6.54%, 신규표본 내 6.86%이며 추가 표본의 20~30대 1~2인 가구가 유지표본과 비교하면 11가구 많은 수준이다.   

최 씨가 문제를 제기하기 전부터 이번 통계에는 1인 가구 및 고령가구주의 비중이 급격히 증가해 빈부 격차가 늘어난 것처럼 ‘착시효과’를 만들었다는 비판이 있었다. 그러나 통계청 자료를 보면 표본에서 1인 가구의 비중은 2016년 25.7%, 2017년 26.8%, 2018년 28.4%로 소폭 증가했다. 2017년 기준 전제 가구 중 1인가구비중이 28.6%라는 점을 생각하면 통계 표본이 모집단을 잘 반영했다고 보는 편이 맞을 것이다. 

통계청은 이번 최진기 씨 영상에 대해 해명으로 내놓은 자료에서 1분위에 신규표본이 높은 이유에 대해 ”청년 가구주와 고령 가구주 가구의 소득이 장년 가구주 가구소득에 비해 평균적으로 낮다는 점, 내수부진 상황에 상대적으로 취약한 점이 복합적으로 작용하여 나타난 결과”라고 설명하고 있다. 이 말을 이번 통계청 자료 전반에 대한 분석으로 봐도 무방할 것으로 보인다. 

PRESENTED BY 네스프레소