차상균 서울대 빅데이터연구원장

차상균 서울대 빅데이터연구원장(전기·정보공학부 교수)은 한국에서 처음 열린 빅데이터 국제 학술회의인 ICDE(International Conference on Data Engineering) 행사의 공동의장(general chair)을 맡았다. 그는 “ICDE는 빅데이터 분야에서 가장 권위 있는 행사”라고 설명했다. “한국에서 이 행사가 열렸다는 것은 한국의 빅데이터 기술이 그만큼 향상됐다는 뜻입니다. 한국이 이 분야에서 어떻게 발전해왔는지 알고 싶어하는 외국 연구자들의 참가 신청이 늘어서 행사 규모가 지난 대회보다 두 배로 커졌습니다.”

빅데이터 기술이 주목받는 것은 복잡하고 방대한 데이터를 분석해 얻은 결과를 기업·정부·공공기관 등 다양한 분야의 의사 결정에 반영할 수 있기 때문이다. “스포츠의 예를 들 수 있겠죠. 센서로 선수의 움직임을 데이터화하고 분석해서 결과를 바로 경기에 반영하는 겁니다. 데이터 분석을 실시간으로 활용하는 시대가 오면 산업, 스포츠 등 모든 분야에 걸쳐 새로운 기회가 열릴 것입니다.”

차상균 서울대 빅데이터연구원장은 “컴퓨터 성능 발전으로 곧 데이터 분석 결과를 실시간으로 활용하는 시대가 올 것”이라고 했다.
▲ 차상균 서울대 빅데이터연구원장은 “컴퓨터 성능 발전으로 곧 데이터 분석 결과를 실시간으로 활용하는 시대가 올 것”이라고 했다. / 이진한 기자

차 원장은 빅데이터 시대를 실현할 요건의 하나로 컴퓨터의 발전을 들었다. “컴퓨터 성능은 5년마다 10배 정도로 향상됩니다. 데이터베이스(DB) 시스템이 처음 등장한 지 35~40년 정도 지났으니 당시에 비하면 상상하기 어려울 정도로 성능이 발전했지요.” 그는 “하드웨어뿐 아니라 소프트웨어도 따라서 발전하는 것을 감안하면 곧 데이터 분석 결과를 실시간으로 활용하는 시대가 올 것”이라고 말했다.

차 원장은 “빅데이터 관련 세부 기술에서는 한국이 앞선 분야도 있지만 아직 전체적으로는 세계 수준에 다소 부족하다”며 “한 단계 더 도약하기 위해 근본적인 변화가 필요하다”고 말했다. “정부가 쓸 수 있는 재원(財源)은 한정적이지요. 이걸로 새로운 아이디어를 지원해줄 수 있어야 합니다. 대학의 젊은 연구자들을 지원해서 여러 연구기관이나 기업과 함께 아이디어를 발전시킬 수 있도록 해줘야 합니다.”

그는 “대학에서도 창업에 관심이 있는 공학도들에게 사업적 측면에서 도움을 줄 수 있는 교육 과정이 필요하다”며 “빅데이터라는 것이 특정 분야만이 아니라 모든 곳에서 활용될 수 있기 때문에 학과의 칸막이에 구애받지 않는 초학제적 접근이 필요하다”고 말했다.

 

라케시 아그라왈 박사

대규모 데이터를 분석해 일정한 패턴이나 유용한 정보를 찾아내는 ‘데이터 마이닝(data mining)’ 분야의 창시자인 라케시 아그라왈(Agrawal) 박사가 한국에 왔다. 최근 각광받는 빅데이터 기술의 근간이 바로 데이터 마이닝이다.

17일까지 서울에서 열린 빅데이터 국제 학술회의 ‘ICDE’ 참석을 위해 방한한 그는 “교육, 의료, 스마트시티가 앞으로 빅데이터의 주요 응용 분야가 될 것”으로 전망했다. IBM·마이크로소프트 연구원을 거쳐 스타트업(창업초기기업)을 경영하는 그가 주목하고 있는 분야는 교육이다. 차량 운전자와 승객을 연결시켜 주는 서비스 ‘우버’처럼, 다방면의 강사들을 모아 인터넷을 통해 교육 수요자들과 연결시켜 주는 것이다. 그는 “이를 통해 교육 비용을 낮추고, 교사가 부족한 저개발국가에 수준 높은 교육 콘텐츠를 공급할 수 있다”고 말했다.

라케시 아그라왈 박사는 “교육·의료·스마트시티가 앞으로 빅데이터의 주요 활용 분야가 될 것”이라고 했다.
▲ 라케시 아그라왈 박사는 “교육·의료·스마트시티가 앞으로 빅데이터의 주요 활용 분야가 될 것”이라고 했다. / 이진한 기자

언뜻 빅데이터와는 무관해 보이는 인터넷 교육에도 데이터 마이닝의 아이디어가 숨어 있다. “종이책 대신 전자책 형태의 교재를 사용하면 학생들이 어느 부분에 흥미를 느끼는지, 어떤 부분이 약한지 실시간으로 파악할 수 있습니다. 이를 교육 콘텐츠 개발에 활용할 수 있죠.”

그는 “데이터 마이닝은 1990년대 초 영국 백화점 업체 ‘막스 앤 스펜서’ 관계자들과의 점심식사 자리에서 시작됐다”고 했다. 당시 막스 앤 스펜서는 대량의 고객 데이터를 확보하고 있었다. 하지만 그것으로 무엇을 할 수 있는지를 몰라 아그라왈 박사에게 조언을 구했다. “우선 소비자 행동 분석을 시작했습니다. 가령 A를 산 사람은 B도 산다는 규칙이 보이면 두 물건을 함께 진열해 매출을 높이는 것이죠.”

과학은 일반적으로 가설을 세우고 검증하는 과정이다. 아그라왈 박사는 “데이터 마이닝은 가설이 없는 상태에서 ‘어떤 가설이 가능할까’를 고민하는 과정이어서 기존의 과학 방법론과 반대되는 면이 있었다”며 “방대한 데이터에서 유용한 가치를 찾아낸다는 의미를 담아 ‘마이닝'(mining·자원 채굴)이라는 용어로 불리게 된 것”이라고 말했다.

정작 그는 “지금은 ‘마이닝’보다는 다른 표현을 더 선호한다”고 했다. “마이닝이라는 말은 데이터를 분석하는 과정만을 강조하는 느낌이거든요. 결국 중요한 것은 그 결과를 의사 결정에 활용하는 것입니다. 데이터 인사이트(insight·통찰력)라는 표현이 더 정확하지 않을까요?”