‘사람보다 독해력 뛰어난’ 한국어AI 46개 ‘순위경쟁’ 치열 : 경제일반 : 경제 : 뉴스 : 한겨레

전체
정치	정치일반 대통령실 국회·정당 행정·자치 국방·북한 외교 정치BAR
사회	사회일반 여성 노동 환경 장애인 인권·복지 의료·건강 미디어 궂긴소식 인사 엔지오 교육 종교
전국	전국일반 제주 호남 영남 충청 강원 수도권
경제	경제일반 금융·증권 산업·재계 자동차 부동산 쇼핑·소비자 IT 직장·취업 중기·스타트업 기업PR 글로벌워치
국제	국제일반 해외토픽 아시아·태평양 미국·중남미 유럽 중국 일본 중동·아프리카 국제기구·회의 국제경제
문화	문화일반 영화·애니 방송·연예 여행·여가 음악·공연·전시 학술 책&생각
스포츠	스포츠일반 축구·해외리그 야구·MLB 골프 바둑 스포츠 특집 경기일정 경기결과
미래과학	미래 과학 기술 환경 시각
애니멀피플	야생동물 반려동물 농장동물 인간과동물 생태와진화
기후변화&	기후정책 기후행동 기후과학 기후적응 에너지와기후 기후와사회
휴심정	마음산책 조현이 만난 사람 휴심정 뉴스
오피니언	사설 칼럼 왜냐면
만화 \| ESC \| 한겨레S \| 연재 \| 이슈 \| 함께하는교육 \| HERI 이슈 \| 서울&
포토	화보
한겨레TV	편성표 한겨레TV 소개 광고·후원 문의 전체 프로그램
뉴스서비스	많이본기사 날짜별한겨레 지난톱기사 디지털초판 RSS서비스 기사제보 기사투고
매거진	한겨레21 씨네21 이코노미인사이트

가 가 가 가 가

대졸 성인남성보다 독해실력 뛰어난 인공지능 다수
LG사이언스파크 인공지능팀 95.39점으로 1위 올라
스켈터랩스는 2위로…삼성SDS, ETRI, 네이버도 상위권

한국어 인식 인공지능들이 엎치락뒤치락하며 치열한 순위 경쟁을 벌이고 있다.

인공지능의 한국어 독해능력 테스트인 코쿼드1.0 순위게시판. ※ 이미지를 누르면 크게 볼 수 있습니다.

인공지능의 한국어 독해능력 테스트인 코쿼드(KorQuAD) 1.0을 기반으로 한 ‘한국어 기계독해능력 평가’에서 이번엔 엘지의 인공지능 프로그램이 최고점을 기록하며 1위에 올랐다. .

엘지는 19일 LG사이언스파크가 개발한 인공지능 프로그램이 코쿼드1.0 기계독해 평가에서 95.39점을 받아 1위를 기록했다고 밝혔다. 직전까지는 올 1월 95.15점을 기록한 스켈터랩스(대표 조원규)가 1위였으나, 반년 만에 순위가 바뀌었다.

인공지능의 한국어 독해능력 실력평가는 엘지시엔에스(LG CNS)가 2018년 12월 공개한 한국어 질의응답 데이터셋을 기반으로 진행된다. 코쿼드(KorQuAD: Korean Question Answering Dataset)는 인공지능의 기계 독해 학습 및 검증을 위해 한국어 위키백과로부터 추출한 표준 데이터 10만개로 구성돼 있다. 성능 평가는 데이터셋에서 추출한 내용을 질문으로 만들어 제시하고, 인공지능 모델이 답을 찾아내는 방식으로 이뤄진다.

이번에 엘지사이언스파크 인공지능의 기계 독해 점수 95.39는 사람이 동일한 독해 문제를 풀었을 때 받은 점수(91.2점)를 뛰어넘는 것이다. 기계 독해 평가의 기준점이 되는 사람은 4년제 대학을 졸업한 성인 6명이다. 2018년 코쿼드1.0은 기계 독해 테스트를 위해 이들 6명에게 문제당 30초 제한을 걸고 일주일(시험 시간은 33시간) 동안 시험을 보아 기준점이 되는 ‘성인의 독해력 평균’ 수치를 만들었는데, 평균점수가 91.2점이었다.

기계 독해 평가 문제의 예를 보면, ‘김영하’에 대한 위키백과 항목 서술내용인 “....1995년 단편 <거울에 대한 명상>을 계간 《리뷰》에 발표하며 작품활동을 시작하였고 이듬해 96년 장편《나는 나를 파괴할 권리가 있다》로 제1회 문학동네 작가상을 수상하였다....”라는 구문이 텍스트로 주어지고, 문제는 텍스트를 변형해 “제1회 문학동네 작가상을 수상한 작품으로, 96년 발표된 장편소설은?” 형태로 출제된다.

현재 코쿼드1.0 테스트에 참여한 인공지능의 성적은 홈페이지에 노출되어 있는데, 모두 97개 인공지능이 평가를 받고 성적을 제출했다. 이중에서 46개 팀은 이미 사람 평균(91.2점)을 넘어선 상태이고, 엘지사이언스파크와 비슷한 95점대도 5곳이나 된다.

2016년 12월31일 방영된 <장학퀴즈>에서 한국전자통신연구원(ETRI)의 엑소브레인이 퀴즈 최고수들을 꺾고 우승하며, 한국어 독해능력을 검증한 바 있다. EBS 캡처.

2위 스켈터랩스외에도 삼성SDS가 95.03점으로 4위, 한국전자통신연구원(ETRI)의 엑소브레인이 95.02로 5위, 네이버 클로바AI가 94.75점으로 8위 등 상위권에 올라 있다. 익명과 개인 개발자의 인공지능도 상위권에 여러 개가 올라 있다. 이 가운데서 전자통신연구원의 엑소브레인은 2016년 장학퀴즈에 출전해 2016년 상·하반기 ‘장학퀴즈’ 왕중왕, 수능 만점자 등 퀴즈달인들과의 경쟁에서 우승을 차지하며 인공지능의 한국어 독해력을 널리 알렸는데, 현재는 엑소브레인보다 뛰어난 한국어 독해 인공지능이 여럿이라는 것을 보여준다. 다수의 인공지능 기계독해 모델은 구글이 개발한 자연언어처리 인공지능 딥러닝 모델 BERT를 활용한 프로그램이다.

엘지는 “엘지사이언스파크 인공지능이 BERT기반 기술에 엘지가 독자적 전처리를 통해 선별된 4억개의 한국어 문장 데이터를 기반으로 한국어에 특화된 형태소 분석기를 개발했다”고 밝혔다. 엘지사이언스파크 AI추진단은 지난달 세계적 권위의 ‘컴퓨터 비전 학회(CVPR)’가 개최한 ‘연속학습 기술 경연대회’에서 캐나다 토론토대와 공동팀을 이뤄 아마존, 도쿄대 등을 제치고 1위를 차지한 바 있다.

구본권 선임기자 starry9@hani.co.kr

항상 시민과 함께하겠습니다. 한겨레 구독신청 하기

언론 자유를 위해, 국민의 알 권리를 위해
한겨레 저널리즘을 후원해주세요

후원하기 후원제 소개

한겨레와 친구하기

매일 아침, 매주 목요일 낮 뉴스의 홍수에서 당신을 구할 친절한 뉴스레터를 만나보세요
데일리H:730 구독 위클리h_weekly 구독
한겨레 공식 인스타그램
Follow @hanitweet
전체기사RSS RSS페이지 목록
한겨레앱

1/ 2/ 3

전체
정치	정치일반 대통령실 국회·정당 행정·자치 국방·북한 외교 정치BAR
사회	사회일반 여성 노동 환경 장애인 인권·복지 의료·건강 미디어 궂긴소식 인사 엔지오 교육 종교
전국	전국일반 제주 호남 영남 충청 강원 수도권
경제	경제일반 금융·증권 산업·재계 자동차 부동산 쇼핑·소비자 IT 직장·취업 중기·스타트업 기업PR 글로벌워치
국제	국제일반 해외토픽 아시아·태평양 미국·중남미 유럽 중국 일본 중동·아프리카 국제기구·회의 국제경제
문화	문화일반 영화·애니 방송·연예 여행·여가 음악·공연·전시 학술 책&생각
스포츠	스포츠일반 축구·해외리그 야구·MLB 골프 바둑 스포츠 특집 경기일정 경기결과
미래과학	미래 과학 기술 환경 시각
애니멀피플	야생동물 반려동물 농장동물 인간과동물 생태와진화
기후변화&	기후정책 기후행동 기후과학 기후적응 에너지와기후 기후와사회
휴심정	마음산책 조현이 만난 사람 휴심정 뉴스
오피니언	사설 칼럼 왜냐면
만화 \| ESC \| 한겨레S \| 연재 \| 이슈 \| 함께하는교육 \| HERI 이슈 \| 서울&
포토	화보
한겨레TV	편성표 한겨레TV 소개 광고·후원 문의 전체 프로그램
뉴스서비스	많이본기사 날짜별한겨레 지난톱기사 디지털초판 RSS서비스 기사제보 기사투고
매거진	한겨레21 씨네21 이코노미인사이트

전체

정치