인공지능이 사진 속 이미지를 식별할 수 있게 된 데는 2007년부터 스탠퍼드대학의 페이페이 리(사진)와 프린스턴대학의 카이 리 교수가 시작한 이미지넷(사진)의 방대한 사진 데이터베이스가 큰 기여를 했다. 페이페이 리는 수십억장의 사진에서 추출한 방대한 이미지 데이터베이스를 누구나 활용할 수 있도록 무료로 공개했다. 유튜브 사진
1년 전 이세돌 9단과 인공지능 알파고 간에 바둑 대결이 펼쳐졌다. 이세돌의 1-4 패배는 인공지능의 기술 수준을 몰랐던 이들에게 충격이었고, 불안과 공포로 확산됐다. 이세돌-알파고 대국 이후 지난 1년간 ‘인공지능’이란 단어는 가정, 일터, 학교, 산업계와 정부에서 빠지지 않는 화제가 됐다.
알파고 덕분에 알려진 인공지능의 세계는 놀라웠다. 컴퓨터는 사진에서 자동으로 사물을 식별하는 것은 물론, 사진과 동영상의 내용이 무엇을 의미하는지 이해하고 설명을 달았다. 지난해 11월 개선된 구글 번역은 주요 언어들 간 전문 통번역사의 기능을 대체할 수 있는 수준이다. 자율주행, 퀴즈대회, 암진단 등 인공지능이 활용된 영역마다 로봇은 인간을 뛰어넘는 성과를 과시했다.
1956년 미국 다트머스대학 콘퍼런스에서 처음 ‘인공지능’이란 용어가 등장한 이래 60여년간 지속적 발전을 해온 결과이지만, 인공지능이 학계와 업계를 넘어 모든 사람들의 화두가 된 것은 최근 몇 년 동안 벌어진 대중적 이벤트와 성취 덕분이다. 구체적으로는 알파고에 적용된 ‘심화신경망’ 방식의 딥러닝이 이미지 인식, 자연어 인식, 통번역 등의 영역에 적용된 결과다. 기계가 사람처럼 이미지를 인식하고 음성을 이해할 수 있다는 것은 사람의 인지능력을 대체할 수 있다는 것뿐 아니라, 자율주행이나 드론, 무기 등 고도의 판단과 정교한 실행이 필요한 영역까지 처리할 수 있다는 것을 의미한다.
인공지능이 딥러닝이라는 방법론을 통해 이처럼 광범하고 강력한 영향력을 갖게 된 배경에는 기존의 접근법과 구별되는 고유의 연구개발 문화가 자리잡고 있다. 인터넷을 기반으로 한 개방과 공유, 오픈소스 문화이다.
■ 개방과 공유, 오픈소스
인공지능 연구에 필수적인 개발 플랫폼과 핵심 개발도구가 개방되어 누구나 활용하고 테스트해볼 수 있는 환경이 확대되고 있다.
알파고를 개발한 구글 딥마인드는 지난해 12월 인공지능 개발 플랫폼인 딥마인드랩을 공개해 누구나 인공지능 알고리즘을 테스트해볼 수 있게 했다. 구글은 이미 2015년 11월 머신러닝과 신경망 연구를 위한 소프트웨어 모둠 텐서플로를 오픈소스로 공개했다. 페이스북도 개방형 머신러닝 개발 플랫폼인 토치를 기반으로 제작된 딥러닝 모델들을 공개했다. 마이크로소프트도 2015년 이미지 인식, 음성 인식, 자연어 인식 기능의 인공지능 개발도구를 개방했다. 인공지능 도우미 코타나, 스카이프의 자동번역 기술도 오픈소스화했다. 2016년 4월 테슬라자동차의 최고경영자 일론 머스크는 10억달러 규모의 비영리 인공지능 연구기관(OpenAI)을 공동출자로 설립해 모든 연구성과를 공개하기로 했다.
인공지능 연구성과물을 오픈소스로 개방하는 것은 물론, 상당한 검토 기간과 절차를 거치는 기존의 논문 평가 방식 대신 연구와 성과를 즉시 공개하고 공유하는 문화가 확산되고 있다. 권위있는 학회가 투고된 논문을 심사위원 평가(피어 리뷰)를 통해 심사하고 학술지를 통해 공개해온 기존 연구평가 관행에 대한 새로운 실험과 도전이 인공지능 분야에서 활발하게 진행되고 있다. 저명 학회에 논문을 발표하기 전에 논문과 실험 자료를 오픈 아카이브(arXiv)에 등록해 많은 연구자들로부터 검토와 평가를 받는 방식이다. 학회지 논문으로 공식 발표되기 이전까지 비공개되던 논문과 실험자료에 대해 공개 접근(오픈 액세스)이 이뤄짐에 따라 이를 활용한 연구개발과 기술발전이 빠른 속도로 확산되고 있다.
이런 배경엔 딥러닝 연구의 돌파구를 연 제프리 힌턴, 요슈아 벤지오, 얀 르쿤 등 학계의 리더들이 값진 연구성과를 오픈소스로 공개하면서 인공지능 연구가 확산되고 빨라지는 선순환 구조가 만들어진 역사가 있다.
인공지능이 사진 속 이미지를 식별할 수 있게 된 데는 2007년부터 스탠퍼드대학의 페이페이 리(사진)와 프린스턴대학의 카이 리 교수가 시작한 이미지넷(사진)의 방대한 사진 데이터베이스가 큰 기여를 했다. 페이페이 리는 수십억장의 사진에서 추출한 방대한 이미지 데이터베이스를 누구나 활용할 수 있도록 무료로 공개했다. 유튜브 사진
■ 개방의 배경
김인중 한동대 교수(전산학)는 지난 7일 판교 소프트웨어정책연구소에서 열린 ‘알파고 대국 이후 1년, 인공지능 이슈와 정책 방향’ 포럼에서 “보통 논문심사에 1년 이상 걸리고 후속 연구가 2~3년 뒤에 가능했던 것에 비해 최근엔 인공지능 연구 공유 사이트를 통해 논문이 선공개되어 반년 만에 후속 연구가 나오는 환경이 됐다”고 발표했다.
인공지능은 교육의 영역에서도 개방과 공유의 흐름을 만들고 있다. 컴퓨터공학 분야에서 업계와 학생들의 수요가 가장 높은 인공지능 분야는 명문대학의 인기 강의 상당부분이 개방형 온라인 강의(MOOC)로 제공되고 있다. 서배스천 스런 스탠퍼드대 교수가 개설한 인공지능 입문 강의에는 세계에서 16만명이 수강하며 ‘세계 최대의 강의실’이 만들어지는 기록을 만들어냈다.
시장 수요가 많고 영향력이 막대한 최첨단 기술이 동시에 가장 개방적인 환경으로 누구에게나 공개되는 이유는 무엇일까? 인공지능 연구를 선도하고 있는 이 분야 선구자들이 오픈소스와 개방을 통한 기술 발전이라는 신념을 공유하면서 실천하고 있기 때문이다. 급속하게 발전하는 인공지능 기술에서 플랫폼을 장악하려는 업계의 경쟁도 배경이다. 구글, 페이스북, 마이크로소프트, 바이두, 아이비엠 등 컴퓨터와 모바일 경쟁에서 기술 플랫폼의 위력을 절감한 정보기술 거대기업들이 개발자 생태계를 장악하기 위한 시도가 개방과 공유로 나타나고 있다.
인공지능은 기존의 모든 분야에 결합되어 활용되면서 전기가 산업구조를 바꾼 것처럼 광범하고 비가역적인 변화를 만들어내고 있다. 이와 함께 인공지능은 특유의 오픈소스 문화를 배경으로 어떤 영역보다 정보 개방과 지식의 공유가 만들어내는 선순환 효과를 보여주고 있다. 인공지능이 사회 각 부문으로 파급되듯 인공지능 연구개발 관행이 기존의 전통적이고 엄격한 다른 학술과 연구 분야로 확대될 수 있을지도 주목된다.
구본권 사람과디지털연구소장
starry9@hani.co.kr