9일 오후 서울 종로구 포시즌스 호텔에서 열린 ‘구글 딥마인드 챌린지 매치‘에서 구글 딥마인드가 개발한 인공지능 프로그램 ‘알파고‘와 이세돌 9단(오른쪽)의 대국이 진행되고 있다. 구글 제공
완벽하게 기획된 예측 시스템을 바탕으로 이세돌 9단에게 압도적인 2연승을 거둔 알파고(AlphaGo). 알파고는 구글에 소속된 스타트업 딥마인드(DeepMind)가 개발한 인공지능 바둑 프로그램이다. 인류에게 충격을 준 알파고에 대해 알아둬야 할 다섯 가지를 묶어봤다.
① ‘알파고’라는 이름은 영어와 한자의 합성이다.
알파고는 ‘알파(Alpha)’와 ‘고(Go)’라는 두 개의 단어를 합친 이름이다. ‘알파’는 그리스어 자모의 첫째 글자로 영어의 A에 해당한다. 이 때문에 ‘최초, 처음, 첫째 가는 것’ 등의 의미를 내포하고 있다. ‘고’는 바둑을 뜻하는 한자 ‘기(碁)’의 일본식 음독이다. 한국에선 ‘기’라고 읽지만, 일본에선 ‘고’라는 음으로 읽히는 것이다. 일본은 서양을 상대로 제일 먼저 바둑을 보급했고, 이 때문에 영어에서도 바둑을 ‘The game Go(더 게임 고)’라고 부른다. 종합하면, 알파고는 ‘바둑에서 첫째가는 것’이라는 의미를 가진 이름이다.
② 알파고는 빅데이터로 연산을 수행한다.
알파고는 1200여대의 중앙처리장치(CPU)가 연결된 슈퍼 컴퓨터로, 빅데이터 연산을 수행하는 소프트웨어다. 알파고는 초당 경우의 수 10만개를 검색할 수 있다. 프로 바둑기사는 다음 수를 놓기 위해 보통 초당 100개의 경우의 수를 고려한다고 한다.
알파고에는 CPU와 더불어 그래픽연산장치(GPU)도 500∼600장 투입됐다. GPU 한 장은 개인용 컴퓨터에 들어가는 CPU보다 최소 8배 이상 빨리 계산할 수 있는 능력이 있다. 바둑 한 수를 두기 위해 최고급 컴퓨터 4000∼5000대를 한꺼번에 동원한 것이라는 계산이 나온다. 더구나 이런 장비를 모두 100Gbps급의 초고속 네트워크로 연결했다. 컴퓨터끼리 정보를 주고받을 때 걸리는 시간을 최소화한 것이다.
③ 알파고는 사람의 두뇌처럼 작동한다.
알파고의 능력은 상상하기 힘든 속도의 연산 능력뿐만 아니다. 알파고는 사람의 두뇌처럼 신경망 구조로 작동한다. 이 신경망 구조가 바로 인공지능 1세대라고 할 수 있는 IBM의 체스 전용 컴퓨터 ‘딥블루’와의 차이점이다.
신경망 구조의 핵심은, 중요한 것만 추려서 걸러내는 수법으로 효용성이 떨어지는 경우의 수를 빨리 내칠 수 있다는 점이다. 그러니 알파고는 모든 경우의 수를 연산하지 않고 가지치기를 통해 중요한 것만 걸러내 효율성을 극대화한다.
신경망 구조는 두 가지로 이뤄져 있다. 정책망과 가치망이다. 우선 정책망(policy network)은 전문 기사 또는 고수들의 바둑 기보를 통해 그 전문 기사들의 ‘다음 수’를 예측하는 능력을 학습하는 것이다. 알파고는 일류 프로 바둑기사의 과거 기보 3000만 수를 학습시킨 뒤 이 바둑판 상태를 추출해 데이터로 사용했다. 프로 바둑기사들의 착수 전략을 최대한 모방할 수 있도록 학습했다. 이를 바탕으로 12계층으로 된 첫 번째 인공신경망인 정책망이 만들어졌다.
가치망(value network)은 해당 위치에 바둑 돌을 놓았을 때 승리 확률을 예측하는 신경망이다. 쌍둥이 알파고 프로그램과 10만 번 이상 대국을 펼치면서 승리한 판의 수들에 가중치를 부여하는 방식으로 실력을 쌓았다. 알파고는 정책망과 가치망이라는 2개의 신경망 구조를 활용해 최적의 한 수를 찾아낸다.
④ 알파고 인공지능의 핵심은 ‘딥 러닝’(심화학습)이다.
알파고는 딥 러닝(deep learning)이라는 방법을 채택했다. 딥 러닝은 컴퓨터가 여러 데이터를 이용해 마치 사람처럼 스스로 학습할 수 있게 하기 위해 인공 신경망 구조를 기반으로 한 기계 학습 기술을 일컫는다. 인간의 두뇌가 수많은 데이터 속에서 패턴을 발견한 뒤 사물을 구분하는 정보처리 방식을 모방해 컴퓨터가 사물을 분별하도록 기계를 학습시킨다.
딥 러닝은 1980년대 개발됐지만 당시 여건이 맞지 않아 빛을 보지 못했다. 재조명된 건 2000년대 들어서다. 딥 러닝이 제대로 작동하려면 수많은 디지털 데이터를 넣어야 하고 이를 분석해야 하는데 1980년대에는 디지털 데이터도 많지 않았고 컴퓨팅 속도도 못 미쳤다.
바둑은 돌을 놓을 수 있는 경우의 수가 최대 250의 150제곱에 달한다. 지구를 포함한 우주의 모든 원자 수(약 10의 80제곱)를 합친 것보다도 월등히 많다. 이 때문에 모든 경우의 수를 시뮬레이션하는 게 아니라, 사람의 전략처럼 패턴 인식을 통해 확률적으로 최선의 수를 찾아내는 방식을 차용할 필요가 있었다. 그 수단이 바로 딥 러닝이었고, 그 결과가 바로 신경망 구조다. 체스 대결에서 모든 경우의 수를 연산하는 딥블루가 한 수마다 2억개의 수를 검토한 반면, 알파고가 한 번 둘 때 검토하는 수는 10만개에 불과(?)했다.
⑤ 알파고의 나이는 2살이다.
이세돌 9단은 33살이다. 이 9단은 지금까지 3만 시간 동안 훈련했다. 알파고 개발을 주도한 딥마인드의 데이비드 실버 리서치 담당은 “이제 겨우 나이가 2살인 알파고도 이 9단과 똑같은 시간 동안 훈련했다”고 밝혔다.
특히 알파고는 지난해 10월 유럽 바둑챔피언 판후이 2단과의 대결에서 승리했을 때의 수준보다 훨씬 더 진화한 상태로 이세돌 9단과 승부했다. 알파고는 100만번의 대국을 학습하는 데 4주 걸린다. 사람의 속도로는 1000년 걸린다. 그러니 알파고는 판후이와의 대결 이후 최소 400만번 이상의 대국을 학습한 상태라고 할 수 있다. 이 때문에 “이세돌 9단이 컴퓨터의 계산에 진 것이 아니라 1200여명의 다른 기사들이 하는 협업 플레이에 진 것”이라는 분석이 나오기도 했다.
이재훈 기자 nang@hani.co.kr
항상 시민과 함께하겠습니다. 한겨레 구독신청 하기