질병 예측·복지 사각 지대 발굴·택시 잡기… 빅데이터의 힘, 시민 생활 ‘빅 체인지’

서울시, 인생이모작센터 건립에 휴대전화 통화자료 10억건 이용

0302 국민일보

공공 영역에도 ‘빅데이터 시대’가 열리고 있다. 교통 복지 등 각종 정책에 빅데이터를 활용하는 시도가 정부와 지방자치단체에서 이어지고 있다. 빅데이터는 기존 방식으로는 수집, 저장, 분석이 어려울 정도로 양이 방대한 데이터를 말한다. 일상의 수많은 데이터가 분석·가공의 과정을 거쳐 택시 잡기, 질병 예측, 복지 사각지대 발굴 등 실생활에 필요한 정책 서비스로 탈바꿈하는 것이다.

‘택시 잡기 좋은 곳’…새 지평을 열다

가장 적극적으로 움직이는 곳은 서울시다. 서울시와 다음카카오는 지난해 말 ‘택시 잡기 좋은 곳’을 알려주는 서비스를 개발, 시민에게 제공했다. 택시 7만여대의 운행기록을 담은 빅데이터가 예측하는 ‘빈 택시’ 정보를 지도 위에 표시한다. 무려 1300억건의 운행기록을 토대로 했다. 스마트폰 애플리케이션에는 ‘확률적으로’ 빈 택시가 많은 도로가 표시된다. 서울시 통계·데이터담당관실 김기병 과장은 1일 “택시마다 달린 운행기록계는 위치와 승객의 승하차 등 각종 정보를 10초마다 생성한다”고 설명했다.

서울시가 직접 서비스를 만들지 않고 다음카카오와 손을 잡은 이유는 공공정보를 개방한다는 원칙 때문이다. 김 과장은 “우리는 데이터를 쓰기 좋은 형태로 가공해 개방하고, 시민과 앱 개발자들은 이를 활용해 다양한 가치를 창출할 수 있다”고 했다.

실제로 택시 운행 빅데이터는 시민뿐 아니라 택시기사에게도 유용하게 쓰일 수 있다. 승차가 많이 이뤄지는 곳의 정보도 추출이 가능하다. 서울시 빅데이터전략팀 마경근 주무관은 “택시기사를 겨냥해 손님을 태울 확률이 높은 곳을 알려주는 앱을 개발 중인 업체도 있다”고 전했다.

전 국민의 진료기록을 갖고 있는 건강보험심사평가원도 빅데이터를 이용한 서비스를 추진하고 있다. 올해 ‘기상변화에 따른 질병 예측’ 개발 작업에 들어갔다. 날씨에 영향을 받는 감염 질병을 미리 예측해 경보 등을 발령하겠다는 것이다. 황의동 심평원 의료정보분석실장은 “국민의 10년 이상 질병 정보를 갖고 있어 이를 기상청의 데이터와 연계하면 여름철 눈병이나 겨울철 노로바이러스 등에 대한 경보를 내릴 수 있다”고 말했다.

공공영역의 빅데이터가 민간에 개방돼 사업화에 성공한 경우도 있다. 앱 개발 업체 ‘버드뷰’는 식품의약품안전처의 화장품 성분·특성 정보를 이용해 ‘화해: 화장품을 해석하다’라는 앱을 만들었다. 이 앱은 시판되는 거의 모든 화장품의 성분 정보를 알려준다. 계면활성제 등 주의성분이 포함됐는지, 피부타입별로 적당한 성분이 들었는지 등이 표시된다. 지난해 상반기 54만건이 다운로드되는 등 성공을 거뒀다.

휴대전화 통화자료 10억건, 정책 수요자를 찾다

정부와 지자체의 빅데이터 이용은 ‘정보 제공 서비스’를 넘어 정책 결정을 돕는 수단으로 진화하고 있다. 공공자원을 수요자에게 골고루 배분하고 얽히고설킨 이해관계를 조정하려면 정확한 정보가 필요하다. 빅데이터는 그동안 정책의 수요 분석이 힘들었던 곳에서 엄청난 힘을 발휘한다.

서울시가 지난해 7월 설립한 ‘도심권인생이모작센터’는 빅데이터를 이용한 수요 분석을 거친 결과물이다. 서울에서 인생이모작센터는 은평구에 먼저 한 곳이 설치돼 운영 중이었다. 서울시는 두 번째 인생이모작센터를 어디에 지을지 고민했다. 후보지로 선정된 종로·마포·구로구 모두 유치를 강력히 원했다.

서울시는 유동인구 분석을 실시했다. 과거라면 주민등록 주소지 통계를 바탕으로 장년과 노인이 더 많은 곳을 찾았겠지만 이번에는 ‘사람들이 많이 움직이는 곳’에 관한 정보가 수요를 더 정확히 잡아낼 것으로 판단했다. 분석에는 이동통신사로부터 건네받은 휴대전화 통화자료 10억건이 쓰였다. 인생이모작센터의 잠재 수요자인 50·60·70대의 착·발신 기록이었다.

분석 결과 종로구가 가장 적합하다는 결론이 나왔다. 결국 도심권인생이모작센터는 서울 지하철 5호선 종로3가역 인근 수표로 26길에 지어졌다. 여기서 끝나지 않았다. 서울시는 최근 인생이모작센터 2곳의 이용 현황을 살펴봤다. 그리고 노원구 지역의 노인이 센터 이용에서 소외돼 있다는 사실을 발견했다. 제3의 인생이모작센터는 이곳에 우선적으로 설립될 가능성이 크다.

택시 운행기록도 정책 수단으로 진일보한 활용이 가능하다. 시내에는 택시 승강장이 설치돼 있지만 손님이 없고 빈 차도 없는 곳이 여럿이다. 반면 택시 타겠다는 사람은 많은데 승강장이 없는 곳도 허다하다. 서울시 마 주무관은 “택시 운행기록에서 출발지와 목적지 빅데이터를 분석하면 최적의 승강장 위치를 찾는 데 도움이 된다”면서 “현재 택시 승강장 신설과 위치 이동에 관한 정책을 수립 중”이라고 말했다.

빅데이터, ‘송파 세 모녀’도 미리 찾아낸다

보건복지부가 준비 중인 ‘위기가구 발굴시스템’은 빅데이터를 활용해 ‘제2의 송파 세 모녀 사건’을 미리 막아보자는 취지다. 복지부는 최근 대통령 업무보고에서 올 하반기부터 단전, 단수, 건강보험료 체납 등의 정보를 바탕으로 위기가구를 선제 발굴하겠다고 밝혔다.

복지부는 현재의 사회보장정보시스템에 단전, 단수 등 정보를 통합할 계획이다. 여기에 ‘위기가구 발굴시스템’을 구축하고, 시스템이 자동으로 위험에 빠져 있을 가능성이 높은 가구를 찾아낸다. 임근찬 복지부 복지정보과장은 “빅데이터가 말해주는 위기가구를 직접 찾아가 보라고 각 읍·면·동의 사회복지 담당자를 푸시(push)할 것”이라고 했다.

복지부는 지난해 말 국회를 통과한 ‘사회보장급여의 이용·제공 및 수급권자 발굴에 관한 법률’에 따라 다른 기관의 공공정보를 가져올 수 있는 권한이 커졌다. 위기에 처해 있다고 교사가 판단한 학생의 학교생활기록 정보도 입수할 수 있게 됐다. 그 밖에도 시행령을 만들거나 고쳐 필요한 정보를 가져올 수 있다.

이렇게 모인 정보에는 패턴분석이 더해진다. 여러 조건을 대입해 위기에 처해 있을 가능성을 확률적으로 판별하는 작업이다. 읍·면·동 사회복지 담당자가 진짜 위기가구인지 확인한 결과는 다시 위기가구 발굴시스템에 반영된다. 임 과장은 “경험적 데이터까지 축적되면 정확도가 더 높아질 것”이라고 말했다.

위기가구 발굴시스템은 장기적으로 부정수급자를 찾는 데도 도움이 된다. 빅데이터는 위기가구 패턴에서 벗어나는 가구 역시 발견할 수 있다. 송태민 한국보건사회연구원 통계정보연구실장은 “그동안은 기관 간 정보 단절로 부정수급자 발굴에 한계가 있었다”며 “진작 이뤄졌어야 하는 일”이라고 말했다. 다만 첫 시도인 만큼 넘어야 할 산이 많다. 복지부와 특정기관 사이에 민감한 개인정보의 제공 범위를 놓고 시비가 붙을 수 있다.

“정보 악용 가능성, 늘 경계해야”

현재 공공영역에서 이용하려는 빅데이터는 전화 통화, 버스·지하철·택시 등 교통수단 이동기록, 신용카드 사용기록, 진료 기록 등이다. 원자료(raw data)에는 개인정보가 붙어 있지만 빅데이터로 활용하기 위해 가공·분석하는 과정에서 이를 걸러낸다. 개인정보 유출 가능성은 크게 걱정하지 않아도 된다는 게 해당 기관들의 설명이다.

그러나 전문가들은 의도하지 않은 정보 악용 가능성까지 신중히 고려해야 한다고 지적한다.

고학수 서울대 법학전문대학원 교수는 “교통 빅데이터에서는 밤늦은 시간 변두리 지역의 사람들 동선이 쉽게 나타날 수 있다”며 “(범죄 등에) 악용될 가능성이 있다”고 지적했다. 그는 “빅데이터는 원자력발전소와 마찬가지로 제대로 이용하면 인류에 획기적으로 도움이 되지만 잘못 사용하면 재앙이 될 수 있다”면서 “의도하지 않더라도 소수의 정보가 드러날 수 있다는 점을 늘 고민해야 한다”고 강조했다. 권기석 기자 keys@kmib.co.kr