숫자로 본 歸省-歸京 지도수도권호남 비율 크고 경남호남 이동도 많아


데이터는 수집보다 분석이나 해석에 더 공을 들여야 한다는 점을 잘 보여주는 기사다
. 뉴스 매체가 데이터를 다룰 때 얼마나 조심해야 하는지도 잘 보여준다.

우선 기사에 나타난 데이터의 성격을 보자. 


"
한국도로공사 도로교통연구원이 2년을 투자해 1998년부터 2008년까지 11년간 고속도로를 오간 차량의 통행 패턴을 전수 조사했다. 주목할 대목은 전국을 경기 강원 충청 호남 경북 경남 6개 권역으로 나눠 이뤄진 권역별 통행량조사다. 대한민국 귀성·귀경 지도를 최초로 그려볼 수 있기 때문이다."


그러니까
11년간 축적된 막대한 통행 데이터를 교통연구원이 2년 동안 분석하였는데, 그 중에 (기사에는 말이 없지만) 설 연휴 기간의 데이터에 특히 주목하여 만든 기사라는 말로 짐작된다. 이후 기사에서 등장하는 수치들은 "11년 동안 설 연휴 5일간" 각 지역 "고속도로 영업소를 통과해 나간 평균치"인 것으로 짐작된다.

기사에서 데이터에 대한 사실적 서술은 큰 문제가 없다. 그러나 분석과 해석은 매우 많은 문제를 안고 있다. 예를 들면,


"'
수도권에 호남 사람 많다는 믿음은 이번 조사에서도 확인됐다. 호남으로 이동한 차량은 경남 경북을 앞질렀다. 지난해 부산 대구 경남 경북 인구는 1180만명, 광주 전남 전북 인구는 510만명이었다. 인구차까지 감안해 보면 지역민이 수도권으로 옮겨가 살고 있는 비율은 호남이 영남보다 압도적으로 높다."


기사에 나타난 실제 데이터를 보자
.


수도권 <-> 내부 이동 : 142만 대
수도권 <-> 강원 : 173천 대
수도권 <-> 충청 : 45만 대(그림에서는 47만대로 나와, 기사 안에서도 일관성이 없다)
수도권 <-> 호남(전남, 전북) : 134천 대
수도권 <-> 영남(경북, 경남) : 172천 대(경북 119, 경남 53)


기사의 논리에 따르자면
, '수도권에 많은 사람'은 호남 사람이 아니라 충청 사람이다. 가장 많은 이동을 보이고 있지 않은가.

게다가 '호남 사람 많다''믿음'을 입증하기 위해, 호남 데이터는 전남북 구분 없이 '호남'으로 묶고, 영남 데이터는 경남과 경북을 따로 구분한 뒤, "호남으로 이동한 차량은 경남 경북을 앞질렀다"라고 썼다. 이런 왜곡은 사실을 호도하는 데이터 분석에서나 나오는 방식이다.


귀경차량들이 꼬리를 물고 늘어서 있다.(경향Web DB)


그보다 우선, "'수도권에 호남 사람 많다'는 믿음은 이번 조사에서도 확인됐다"라는 서술부터 문제 투성이이다. 누가 믿는다는 말인가? 기자가? 일반 사람이? 보통 사람의 믿음을 기사에 그대로 갖다 써도 되는 것인가? 설령 "'수도권에 호남 사람 많다'는 속설은..."이라고 썼다 해도 마찬가지다. 이런 말을 쓰고 싶었으면 먼저 수도권 거주자의 출신 지역별(?) 데이터를 먼저 명시해 놓고 '이런 상황이 설 연휴 차량 이동을 통해서도 입증되었다'라고 서술해야 할 것이다. 그런 데이터가 있는지도 모르겠지만 말이다.

이런 뚜렷한 근거도 없이, 그저 휴일의 차량 통행량만으로 "인구차까지 감안해 보면 지역민이 수도권으로 옮겨가 살고 있는 비율은 호남이 영남보다 압도적으로 높다"는 과감한 결론을 내린다. 그것이 설령 사실이라도, 문제의 데이터는 이런 결론을 전혀 뒷받침해 주지 않는다.

그것 말고도 많은 문제가 있다.

1. 데이터는 출발과 도착지를 구분하지 않고 이동량만 따졌다. 말하자면 서울에서 경남을 다녀온 차량과 경남에서 서울을 다녀온 차량이 구분되지 않았다. 따라서, 차량 이동 패턴으로는 볼 수 있어도, 어디 지역 출신이 어디에 옮겨 와 산다는 증거는 전혀 되지 못한다. 역의 가능성도 포함되어 있기 때문이다.

2. 데이터에서는 충청 지역 이동량이 가장 많은 것으로 나타났다. 이 차량들이 모두 충청 지역으로만 갔기 때문인가? 당연히 아닐 것이다. 문제의 데이터가 고속도로 통행량만을 집계한 것이라는 점을 고려해야 할 것이다. 해석에 주의가 필요한 부분이다.

3. 닷새나 되는 연휴에 고속도로를 달리는 차들은 모두 고향으로 가는 차들인가? 이것도 당연히 아닐 것이다. 그 중 많은 차량은 연휴를 이용해 놀러 나선 행렬일 것이다.

그런데도 기사는 끝까지 '어디에서 어디 지역으로 옮겨 가서 사는 지역민'을 거론하고 있다. 그런 사정을 보기에는 무리가 있는 데이터다.

기사 맨 마지막은 다음과 같다.

 

"영호남 지역갈등이란 말도 차량 통행 패턴 상으로는 도드라지지 않았다. 경남에서 호남으로 이동한 차량은 7만대로 경남에서 수도권으로 이동한 차량(46000)보다 많았다."

기사의 논리에 따르면 경남에서 수도권으로 옮겨 가 사는 사람보다 경남에서 호남으로 옮겨 가 사는 사람이 더 많다는 뜻이 된다. 이게 말이 되는가?

데이터는 모아 놓기만 해서 아무런 의미가 없다. 해석을 해야 데이터로서 생명력이 생기는 것이며, 이 과정에서 편견과 오류가 개입한다면 데이터를 모아 분석하지 않느니만 못하다.

이 기사에는 단 하나 미덕이 있다. 제목이다. 기사 내용에 나타난 억지스러운 해석을 끌어 당겨 눈에 확 띄는 제목으로 올렸을 법도 한데, 이 기사의 제목은 "숫자로 본 歸省-歸京 지도수도권호남 비율 크고 경남호남 이동도 많아"라고 하여 아주 조심스러운 언어를 선택하여 제목으로 삼았다. 그 결과, 제목이 좀 길어졌다. 독자의 눈길만을 잡아 끌기 위해 제목 따로, 내용 따로인 낚시 제목도 마다하지 않는 세태에 귀감이 될 만한 제목이다. 제목 만든 사람의 고민이 읽힌다.

Posted by 미디어로그 칸미디어