(※클릭하면 이미지가 커집니다.)이성우 서울대 교수가 통계 원자료 확보 과정에서 겪은 사연
‘사교육-강남권 전세 거주 관계’
인구주택총조사 통해 분석해서
세계학술대회 논문 내려했지만 예정보다 9개월 늦게 공개
가구 표본 ‘2%→1%’ 변경도
“연구 접으라는 소리밖에 안돼”
이 교수는 2011년 중순께, 주택 문제에 대해 본격적으로 분석해보기로 마음먹었다. ‘자기 집 가진 사람들이 왜 그 집을 전세 내주고, 남의 집에서 전세를 살까?’ 이 의문에서 시작된 연구였다. 한국 사회에서 부동산과 주거가 가진 의미가 크기 때문에, 그 실태를 분석하면 사회의 여러가지 모순점이 드러날 수 있다고 여겼다.
이 교수는 이에 통계청의 인구주택총조사(센서스) 결과를 분석하기로 결정했다. 통계청은 5년에 한 번씩 모든 국민을 대상으로 하는 인구주택총조사(센서스)를 하는데, 여기에 들어가는 예산만 1800억여원 수준이다. 센서스는 전 국민의 실제 주소지와 가구 소득, 집값 등을 조사하는 가장 방대한 통계 자료다. 주거 방식과 소득 수준, 주소까지 모두 드러나는 자료인 만큼 연구 아이디어와 맞춤이라는 생각이었다. 초기 연구는 일사천리로 진행됐다. 이 교수는 통계 분석에 익숙한 사람이었고, 1990·1995·2000·2005년치 센서스 자료는 이미 시디(CD) 형태로 구입해 놓은 상황이었다. 이 교수는 이들 자료에 대한 분석을 2012년 7월께 이미 모두 완료를 했다고 한다.
이같은 연구에 대해 외국 학회도 흥미를 보이기 시작했다. ‘세계서부지역학회’(Western Regional Science Assosiation)는 논문을 ‘입도선매’해, 2013년 2월 미국 캘리포니아 산타바바라에서 열릴 학술대회에 발표 일정까지 잡았다. 세계서부지역학회는 지리학·도시공학과 관련해 가장 규모가 큰 학회 가운데 하나다. 이 교수는 성과를 제대로 발표할 수 있다는 생각에 더 열심히 분석 작업을 진행했다고 한다. 미국 캘리포니아주립대 로스앤젤리스 캠퍼스(UCLA)의 윌리엄 클라크 교수(지리학)가 이 교수를 찾아 서울을 방문하기도 했다. 2월 학술대회에서 이 교수의 상대 토론자로 나설 예정이었기 때문이다.
그런데 일이 꼬이기 시작했다. 통계청은 2010년 센서스를 시작할 당시, 2011년 말 이후 원자료를 공개하겠다 밝혔다. 이 교수는 국가기관의 약속을 믿고 연구를 진행한 셈이다. 그런데 ‘짜장면 배달 독촉’이 시작됐다. 이 교수가 2011년 말 통계청에 문의하자, 통계청은 “2012년 3월이면 나온다”고 답했다고 한다. 2012년 3월에도 공개되지 않아 문의했더니 6월로, 6월에 다시 문의했더니 9월로, 차일피일 자료 공개가 미뤄졌다. ‘세계서부지역학회’에 논문을 보내기로 한 시점은 2012년 10월15일이었다. 이 교수는 점점 마음이 급해졌다. 그러나 결국 통계청이 자료를 공개한 시점은 2012년 9월말 쯤이었다.
그런데 결국 원자료를 받아본 2012년 9월말, 이 교수는 또 한번 놀랐다. 자료 공개 방식이 갑자기 바뀌어, 연구 자체를 진행할 수 없었기 때문이다. 통계청은 2005년 센서스 원자료까지는 전체 가구수의 2%를 시디에 복사해 줬는데, 2010년부터 갑자기 그 범위를 1%로 제한했다. 시간순으로 수치를 비교 분석하는 게 무의미해진 셈이다. 또 시·군·구 등 지역별 분류도 사라졌고, 경제적 변수(가구별 소득·전셋값·집값)에 의한 분류도 불가능해졌다. 이 교수는 “자료 자체에 문제만 없었다면 밤을 새더라도 분석을 마칠 수 있었겠지만, 시계열의 연속성이 끊겨 분석을 할 수 없었다”고 말했다. 결국 이 교수는 논문을 마무리하지 못했고, 학술대회 발표 역시 무산됐다. 이 교수는 “무엇보다 학자로서 기본적인 약속마저 지키지 못한 게 너무 부끄럽다”고 말했다.
이 교수는 스스로도 해당 논문 주제가 아깝다고 말했다. 2005년까지 연구 결과를 보면, 한국에서 자기 집을 갖고도 임대주택에 거주하는 사람들은 대부분 학군, 사교육 등 교육 문제 때문에 임대를 살고 있는 것으로 나타났다. 사교육 문제 해결이 주택 문제의 고리로 부각될 수 있는 논문이었다. 실제 ‘자발적 임대거주자’는 지역별로는 강남·서초·송파구에 집중돼 있었고, 가족구성 형태는 18세 이하 자녀를 둔 부부인 경우가 절반을 넘는 것으로 나타났기 때문이다. 이 교수는 여기에 ‘자발적 임대거주자’의 출신 지역까지 분석해 보려고 했다. 어느 지역 출신자들이 사교육에 열을 올리는지 등을 알아 볼 수 있다고 여겼다는 것이다.
이 교수는 1998년부터 강단에 섰는데, 그동안 국내외 학술지에 160건 남짓한 논문을 발표했다. 그 가운데 130~140건의 논문은 통계 분석에 의한 것이었다고 한다. 그는 “내가 특별한 게 아니라 대부분의 사회학자들은 통계를 연구하고 있다”고 겸손하게 말했다. 그러나 통계청 이야기가 나오자 “지금처럼 자료를 공개하면, 나 같은 사람들 연구 접으라는 소리밖에 안 된다”고 목소리를 높였다. 사실 이 교수는 앞서 2004년에도 통계청에 정면으로 문제제기를 한 바 있었다. <조선일보>에 기고한 ‘쓸데없는 통계 양산하는 통계청’이라는 글에서, “유학 시절 공짜로 제공되는 알짜배기 통계자료를 분석할 당시에는 학자로서 국제경쟁력이 있다고 느꼈는데, 지금 한국에 와서 통계를 분석한 논문 가운데 국제경쟁력이 있다고 느껴지는 논문은 극소수에 불과하다”고 토로했다. 통계청 원본 자료 자체의 신뢰성이 떨어지는 데다, 구체적인 정보는 공개도 않기 때문에 ‘수박 겉핥기’만 하고 있다는 아쉬움이 묻어나는 글이었다.
이 교수는 “수많은 학자들이 통계청에 대해서 나와 비슷한 아쉬움이 있을 것”이라고 말했다. 사람과 사회를 숫자로 보여주는 통계를 자유롭게 이용해, 사람과 사회를 탐구하는 학문에 기여하고 싶다는 얘기였다. 국가통계기본원칙은 “국가통계는 모든 이용자들이 쉽고 편리하게 접근하여 활용할 수 있어야 한다”고 규정하고 있다. 통계청의 답이 궁금해진다.
노현웅 기자 goloke@hani.co.kr
“50년치 자료 표준화하려 표본 축소”
통계청의 해명은 통계청 안에는 통계 생산 부서와 정보 제공 부서가 함께 존재한다. 통계 생산 부서가 인구주택총조사 등 조사를 벌이고 분석해 수치를 만들어 내고, 정보 제공 부서는 각 정부부처와 연구진이 통계를 활용할 수 있도록 서비스한다. 통계청은 내부 규정에 따라 통계 생산 부서의 과장급 15명으로 구성된 통계자료제공심의위원회를 운영한다. 통계별 원자료 제공 범위 설정, 자료 제공 여부 등을 심의·결정한다. 위원회는 다양한 계층의 이용자를 위해 제한없이 제공하는 것을 원칙으로 하고 있다. 다만, 통계 조사 대상자의 비밀 보호를 위해 보호되는 범위는 공개 대상에서 제외된다. 각 통계의 원자료 제공 범위는 천차만별이다. 통계마다 조사 방법과 특성이 달라, 개인정보 보호 범위가 각각 다르기 때문이다. 이성우 서울대 교수의 사례에서 보듯 통계 제공 시점 역시 임의적이다. 추출된 원자료의 검증 등에 필요한 시간을 못박듯 정할 수 없기 때문이다. 공표가 마무리된 통계는 한달 안에 원자료를 공개한다는 통계청 내부 지침을 갖고 있지만, 강제력은 없다. 이에 대해 통계청 관계자는 “원자료 공개를 서두르는 것보다는 정확성이 더 중요하다”고 말했다. 각종 연구·정책생산에 활용되는 자료인 만큼 신속성보다는 정확성에 집중한다는 설명이다. 통계청은 이 교수의 문제제기에 대해선 최선을 다하고 있다고 답했다. 전체 샘플의 2% 원자료를 제공하지 않고, 1%만 제공한 것은 전체 통계 공개를 위한 과정에서 빚어진 일이라고 해명했다. 통계청은 지난 3월 50년(1960~2010년)치 센서스의 1% 원자료를 무상으로 전국민에게 공개했다. 통계청이 구축한 마이크로데이터 서비스 시스템(mdss.kostat.go.kr/mdssext)에서 내려받을 수 있다. 그런데 과거 센서스 가운데 1% 표본만 추출한 경우가 있었다. 이 교수가 어려움을 겪었다는 1% 원자료는 50년치 자료를 표준화하기 위해 어쩔 수 없는 일이었다는 설명이다. 통계청 관계자는 “국가 예산으로 만들어 낸 데이터가 사회 전체의 자산이라는 점은 통계청도 공감하고 있다”고 말했다. 센서스 무상 공개와 같은 구체적인 행보로 답하겠다는 의미다. 노현웅 기자 <한겨레 인기기사>
■ [단독] 여야, 전두환 추징시효 ‘10년 연장’ 사실상 합의
■ 삼성 출신 ‘구리왕’ 의문의 재산 1조 진상 드러날까
■ 박지성 “김민지가 골보다 좋아”…7월 결혼설은 부인
■ 참치 맛 본 중국인 때문에…생선값 폭등
■ [화보] 인도 ‘최악의 홍수’…갠지스강 범람까지
인구주택총조사 통해 분석해서
세계학술대회 논문 내려했지만 예정보다 9개월 늦게 공개
가구 표본 ‘2%→1%’ 변경도
“연구 접으라는 소리밖에 안돼”
이성우 교수
연구자들은 통계청이 관리하는 국가통계의 접근성이 떨어져 기초 연구와 분석이 크게 제한되고 있다고 지적한다. 사진은 2010년 10월30일 경북 울릉도 앞바다의 한 선상에서 통계청 직원과 독도 주민이 ‘2010 인구주택총조사’에 대한 이야기를 주고받는 모습. 독도/사진공동취재단
“50년치 자료 표준화하려 표본 축소”
통계청의 해명은 통계청 안에는 통계 생산 부서와 정보 제공 부서가 함께 존재한다. 통계 생산 부서가 인구주택총조사 등 조사를 벌이고 분석해 수치를 만들어 내고, 정보 제공 부서는 각 정부부처와 연구진이 통계를 활용할 수 있도록 서비스한다. 통계청은 내부 규정에 따라 통계 생산 부서의 과장급 15명으로 구성된 통계자료제공심의위원회를 운영한다. 통계별 원자료 제공 범위 설정, 자료 제공 여부 등을 심의·결정한다. 위원회는 다양한 계층의 이용자를 위해 제한없이 제공하는 것을 원칙으로 하고 있다. 다만, 통계 조사 대상자의 비밀 보호를 위해 보호되는 범위는 공개 대상에서 제외된다. 각 통계의 원자료 제공 범위는 천차만별이다. 통계마다 조사 방법과 특성이 달라, 개인정보 보호 범위가 각각 다르기 때문이다. 이성우 서울대 교수의 사례에서 보듯 통계 제공 시점 역시 임의적이다. 추출된 원자료의 검증 등에 필요한 시간을 못박듯 정할 수 없기 때문이다. 공표가 마무리된 통계는 한달 안에 원자료를 공개한다는 통계청 내부 지침을 갖고 있지만, 강제력은 없다. 이에 대해 통계청 관계자는 “원자료 공개를 서두르는 것보다는 정확성이 더 중요하다”고 말했다. 각종 연구·정책생산에 활용되는 자료인 만큼 신속성보다는 정확성에 집중한다는 설명이다. 통계청은 이 교수의 문제제기에 대해선 최선을 다하고 있다고 답했다. 전체 샘플의 2% 원자료를 제공하지 않고, 1%만 제공한 것은 전체 통계 공개를 위한 과정에서 빚어진 일이라고 해명했다. 통계청은 지난 3월 50년(1960~2010년)치 센서스의 1% 원자료를 무상으로 전국민에게 공개했다. 통계청이 구축한 마이크로데이터 서비스 시스템(mdss.kostat.go.kr/mdssext)에서 내려받을 수 있다. 그런데 과거 센서스 가운데 1% 표본만 추출한 경우가 있었다. 이 교수가 어려움을 겪었다는 1% 원자료는 50년치 자료를 표준화하기 위해 어쩔 수 없는 일이었다는 설명이다. 통계청 관계자는 “국가 예산으로 만들어 낸 데이터가 사회 전체의 자산이라는 점은 통계청도 공감하고 있다”고 말했다. 센서스 무상 공개와 같은 구체적인 행보로 답하겠다는 의미다. 노현웅 기자 <한겨레 인기기사>
■ [단독] 여야, 전두환 추징시효 ‘10년 연장’ 사실상 합의
■ 삼성 출신 ‘구리왕’ 의문의 재산 1조 진상 드러날까
■ 박지성 “김민지가 골보다 좋아”…7월 결혼설은 부인
■ 참치 맛 본 중국인 때문에…생선값 폭등
■ [화보] 인도 ‘최악의 홍수’…갠지스강 범람까지
항상 시민과 함께하겠습니다. 한겨레 구독신청 하기