【짬】한국전자통신연구원 지식마이닝실 김현기 실장
지난달 31일 방송된 <교육방송>의 ‘장학퀴즈’에서 한국전자통신연구원(ETRI)이 개발한 한국어 인공지능 ‘엑소브레인’(Exobrain)이 쟁쟁한 출전자들을 상대로 우승을 차지했다. 지난해 상·하반기 ‘장학퀴즈’ 왕중왕, 2016학년도 수능 만점자, ‘지니어스’ 준우승자 등 퀴즈의 달인 4명은 처음 출전한 엑소브레인의 상대가 되지 못했다. 엑소브레인은 600점 만점에 총점 510점을 획득하며 350점을 얻은 차점자를 일찌감치 따돌렸다. 엑소브레인은 ‘몸 바깥에 있는 또 하나의 두뇌’라는 뜻이다. 엑소브레인의 ‘장학퀴즈’ 출연은 2011년 미국의 퀴즈쇼 <제퍼디>에서 아이비엠(IBM)이 벌인 대결과 유사하게 진행됐다. 질의응답 정확률에서 2011년 왓슨은 70%를, 2016년 엑소브레인은 88%를 보였다. 엑소브레인 개발을 이끈 김현기(사진) 전자통신연구원 지식마이닝실장을 지난달 23일 전화로 인터뷰했다.
한국형 ‘또하나의 두뇌’ 개발 주역
12만권 텍스트 이해 6일이면 가능
‘언어처리력’ 집중…수리엔 취약해
퀴즈대회 첫 출전 압도적 실력
인터넷 검색 가능땐 더 유능해져
“올해는 언어 의도 이해에 도전”
-엑소브레인은 어떤 기술을 활용하는가.
“사람들이 말하는 한국어를 텍스트 기반으로 처리하고 이해하는 기술, 단어의 품사와 구문 속성 등을 이해하는 지식축적 및 탐색 기술, 여러 문장으로 구성된 복합적 질문을 분석하고 이해하는 질의응답 기술 등 3가지가 핵심이다.”
-특별히 풀기 어려웠던 문제 유형은.
“한국어 처리에 특화된 인공지능이라 영어나 수식이 포함된 문제를 풀지 못했다. 아직 학습을 하지 않은 분야이거나 정답을 추론할 수 있는 데이터가 부족한 영역의 문제 처리도 어려웠다. ”
-복합적 문장으로 구성된 퀴즈에 대한 답은 어떻게 추론하는가.
“40~50개 단어, 2~3개의 문장으로 구성된 퀴즈를 풀기 위해 우선 부분 문제를 분리해내어 문제별로 답을 낸다. 부분 문제별로 평균 답이 450개 정도 나오면 그 가운데서 가장 많은 조건을 충족시키는 답을 추론해낸다. 최종적으로 남은 정답 후보들을 다시 질문에 대입해 검산해보고 높은 확률일 경우 정답으로 확정한다.”
-지난해 수능 만점자도 꺾었는데, 엑소브레인이 수능에 출전해도 사람을 능가하는가.
“엑소브레인은 언어처리 기술에 집중한 인공지능인데 수능은 다중 지능을 평가하는 시험이다. 수능에는 화학기호, 도표, 삽화, 그래프 등의 지문과 문제가 나오는데 엑소브레인은 아직 이런 정보를 처리할 수 없다. 일본도 대입 시험에 도전하는 인공지능을 개발하려다 최근 포기했다.”
-엑소브레인이 백과사전 등 책 12만권 분량의 정보를 학습했다는데, 시간은 얼마나 걸렸나.
“컴퓨터들을 연결해 처리하는 병렬컴퓨팅 방식으로 6일 걸렸다.”
-이번엔 인터넷 연결 없이 퀴즈를 풀었는데, 인터넷이 연결되면 능력이 달라지는가.
“엑소브레인 자체의 능력을 보여주기 위해 인터넷 연결을 하지 않았다. 하지만 인터넷이 연결되어 검색을 이용할 수 있다면 실력은 월등히 개선될 것이다.”
-언어 처리 능력을 갖췄으면 엑소브레인이 사람이 말하는 의도도 이해할 수 있는가.
“‘장학퀴즈’에서 사람을 이긴 것처럼 엑소브레인이 상식은 사람 수준이지만, 사람 대화의 의도를 파악하는 것은 어려운 문제다. 대화는 맥락과 의도가 있는데 이를 알아내는 사람에게도 어려운 일이다. 세계적으로도 성공 사례가 아직 없다. 엑소브레인은 올해부터 본격적으로 언어의 의미 이해에 도전할 계획이다.”
-시리와 같은 스마트폰 음성비서 시비스나 챗봇 등은 화자의 의도를 이해하고 적절한 반응을 보이는데?
“현재의 채팅 로봇 같은 인공지능은 대화의 의미와 의도를 이해하는 게 아니라 대화의 쌍을 통계적으로 처리하는 수준에 불과하다. 의미 이해 없이 처리하는 방식일 따름인데 마치 기계가 사람이 말하는 의도와 의미를 이해한 것처럼 보이는 것이다.”
-앞으로 추가 개발과 활용 계획은?
“엑소브레인은 2013년 시작된 10개년 프로젝트로, ‘장학퀴즈’ 출전은 1단계 개발 검증을 위한 절차였다. 2020년까지 진행될 2단계에서는 응용기술을 개발해 상담·법률·특허 등 전문지식 질의응답 체계를 구축할 계획이다. 2022년까지 진행될 3단계에서는 영어로 된 전문 지식 처리능력을 개발해 지능형 로봇에 접목시킬 예정이다.”
구본권 사람과디지털연구소장 starry9@hani.co.kr
김현기 전자통신연구원 지식마이닝실장
인공지능 ‘엑소브레인’이 지난달 31일 방송된 <장학퀴즈>에서 수능 만점자 등 쟁쟁한 퀴즈왕들을 물리치고 우승했다. 전자통신연구원 제공
연재짬
항상 시민과 함께하겠습니다. 한겨레 구독신청 하기