이세돌 9단이 ‘알파고’와 첫 대결을 벌이기 전날, 난 한창 청탁받은 잡지 원고 마감 중이었다. 이 세기의 대결을 주제로 삼긴 했지만, 난감했다. 첫 대국이 시작하기 전에 원고는 마감해야 했고, 책이 나왔을 땐 이미 대국 결과가 나왔을 터. 경기가 시작하기 전에 관전평을 해야 하는 모순에 빠졌다. 나는 알파고에 걸었고, 선택은 맞았다. 내 원고는 무사히 살아남았지만 뒤끝은 개운치 않았다. 한일전 축구에서 일본에 걸어 돈 딴 기분이 꼭 이럴 거야.
알파고의 후손들은 승승장구했다. 의사보다 더 정확히 암을 진단했고, 과학자들이 50년 동안 풀지 못했던 단백질 구조를 분석해냈다. 때론 인간이 잡아내기 힘든 멸종위기 동물을 찾아냈고, 영화를 찍고, 음악을 만들고, 그림을 그리고, 범죄자를 잡아냈다.
인공지능은 이제 인간의 언어를 탐낸다. 오픈에이아이(OpenAI)가 2020년 6월 내놓은 ‘지피티(GPT)-3’이 발화점이다. 지피티-3은 언어에 특화된 인공지능이다. 방대한 언어 데이터를 기반으로 사람 못지않은 수준의 대화를 나눌 수 있다. 지피티-3을 소개한 <가디언> 기사의 제목은 이렇다. ‘
로봇이 이 기사를 전부 썼다. 두려운가 인간이여?’ 사실 <가디언>의 기사도 지피티-3이 직접 썼다.
지피티-3은 ‘인류 역사상 가장 뛰어난 인공지능’으로 꼽히지만, 한계가 있었다. 학습한 언어 데이터의 93%가 영어였다. 영어는 유창하게 구사했지만 한국말은 서툰 인공지능이었다.
그런데 사정이 바뀌었다. 방대한 한국어를 집중 학습한 한국형 지피티-3이 지난해부터 하나둘 등장했다. 네이버는 지난해 5월 개발자 행사에서 ‘하이퍼클로바’(<
사진>)를 내놓았다. 하이퍼클로바는 네이버 뉴스 50년치, 네이버 블로그 9년치 분량의 한국어를 학습했다. 원조 GPT-3보다 많은 학습량으로, 한국어만 놓고 보면 5600배 많은 데이터를 공부했다.
하이퍼클로바를 활용하면 ‘시리야’나 ‘헤이 구글’보다 훨씬 사람 같은 인공지능 서비스를 만들 수 있다. 정치 현안이나 철학 용어를 놓고 인간과 토론할 수도 있고, 사람처럼 전화나 채팅으로 고객을 응대하는 것도 머잖았다. 한국어 기사도 쓸 수 있을까. 네이버 자체 실험 결과를 들어보면 한마디로 “나쁘지 않았다”고 한다. 아직 완벽하진 않지만, 창작 용도로 쓸 만한 수준이란 얘기다. 네이버는 일부 스타트업을 대상으로 하이퍼클로바를 비공개 테스트 중이다.
카카오도 ‘
코지피티(KoGPT)’로 경쟁에 뛰어들었다. 하이퍼클로바보다 학습량은 조금 부족하지만, 누구나 쓸 수 있도록 오픈소스 형태로 공개했다. 사용 조건만 지키면 누구나 이 ‘한국어 인공지능’을 가져다 서비스에 쓸 수 있다는 얘기다. 두 회사는 텍스트뿐 아니라 음성, 이미지, 동영상 등 다양한 형식으로 초거대 한국어 모델을 확장할 예정이다. 에스케이텔레콤(SKT)과 케이티(KT), 엘지전자 등 국내 기업들도 자체 지피티-3 모델을 개발하거나 일부 시험 적용 중이다.
사람과 물 흐르듯 대화하는 인공지능은 아직까진 성급한 미래로 보였다. 그 인식의 간극이 바투 좁혀졌다. ‘인간 최후의 유희’라 믿었던 바둑도 알파고에 돌을 던졌다. 뉴스룸에도 알파고가 등장할까. 또 내기를 건다면, 이번엔 지피티-3에 먼저 의견을 물어볼 심산이다. 미디어전략팀장
asadal@hani.co.kr