단어 하나 바꾸니 ‘인공지능’ 먹통으로 : 미래 : 미래&과학 : 뉴스 : 한겨레

전체
정치	정치일반 대통령실 국회·정당 행정·자치 국방·북한 외교 정치BAR
사회	사회일반 여성 노동 환경 장애인 인권·복지 의료·건강 미디어 궂긴소식 인사 엔지오 교육 종교
전국	전국일반 제주 호남 영남 충청 강원 수도권
경제	경제일반 금융·증권 산업·재계 자동차 부동산 쇼핑·소비자 IT 직장·취업 중기·스타트업 기업PR 글로벌워치
국제	국제일반 해외토픽 아시아·태평양 미국·중남미 유럽 중국 일본 중동·아프리카 국제기구·회의 국제경제
문화	문화일반 영화·애니 방송·연예 여행·여가 음악·공연·전시 학술 책&생각
스포츠	스포츠일반 축구·해외리그 야구·MLB 골프 바둑 스포츠 특집 경기일정 경기결과
미래과학	미래 과학 기술 환경 시각
애니멀피플	야생동물 반려동물 농장동물 인간과동물 생태와진화
기후변화&	기후정책 기후행동 기후과학 기후적응 에너지와기후 기후와사회
휴심정	마음산책 조현이 만난 사람 휴심정 뉴스
오피니언	사설 칼럼 왜냐면
만화 \| ESC \| 한겨레S \| 연재 \| 이슈 \| 함께하는교육 \| HERI 이슈 \| 서울&
포토	화보
한겨레TV	편성표 한겨레TV 소개 광고·후원 문의 전체 프로그램
뉴스서비스	많이본기사 날짜별한겨레 지난톱기사 디지털초판 RSS서비스 기사제보 기사투고
매거진	한겨레21 씨네21 이코노미인사이트

가 가 가 가 가

[구본권의 사람과디지털]
사람은 이해하는 동의어 대체에 인공지능 취약
기계 이미지 인식에서 쓰인 ‘적대적 사례’ 현상
인공지능 자연어 처리 의존도 높아 새로운 위협

현재의 자동번역 기능도 동음 이의어나 미묘한 표현을 제대로 처리하지 못해, 다양한 오류를 만들어내고 있다.

인공지능 자연어 처리 시스템(NLP)을 손쉽게 무력화시킬 수 있는 소프트웨어가 개발됐다. 문장의 단어 하나를 동의어로 대체할 경우 사람은 동일한 의미로 읽어내지만 인공지능은 전혀 다른 의미로 파악하게 하는, 일종의 인공지능 무력화 방법이다.

<엠아이티(MIT) 테크놀로지 리뷰>와 <벤처비트>의 지난 7일 보도에 따르면, 미국 매사추세츠공대(MIT) 컴퓨터인공지능연구실(CSAIL)은 홍콩대학, 싱가포르 과학기술청과 공동으로 인공지능 자연어 처리 시스템을 무력화시키는 프로그램 ‘텍스트풀러(TextFooler)’를 개발했다.

텍스트풀러는 테스트 문장에서 주요 단어를 동의어로 대체했는데, 사람은 동일한 의미로 받아들였지만 자연어 처리 시스템은 전혀 다른 의미로 받아들여 오류율이 극적으로 높아졌다. 10% 미만의 오류율을 보이던 자연어 처리시스템에 텍스트풀러를 적용하자 2배 가까운 20% 이하의 오류율을 보였다. 현재 가장 정확도 높은 자연어 처리 시스템인 구글의 버트(BERT) 또한 이러한 방식의 테스트에 매우 취약함이 드러났다. 버트의 오류율이 5~7배 높아진 것으로 테스트 결과 밝혔졌다.

예를 들면 소프트웨어는 테스트에서 “불가능하게 꾸며진 상황 속으로 캐스팅된 등장인물들은 완전히 현실과 동떨어져 있다”(The characters, cast in impossibly contrived situations, are totally estranged from reality) 문장에서 단어 둘을 같은 의미로 바꾸었다. ‘contrived situations’을 ‘engineered circumstances’으로 대체했다.(“The characters, cast in impossibly engineered circumstances, are fully estranged from reality”). 사람들은 이 두 문장을 동일한 의미로 이해했지만, 자연어 처리 시스템은 완전히 다르게 해석하며 오류를 일으켰다.

사람이 알아 차리는 방식에는 거의 동일한 것으로 보이지만, 기계인식에는 둘을 완전히 다른 것으로 처리되는 이 구조를 인공지능의 ‘적대적 사례(adversarial examples)’라고 부른다. 그동안 인공지능의 적대적 사례가 주로 시각 이미지를 대상으로 연구되어왔는데 ‘텍스트풀러’는 자연어 처리 시스템에서도 거의 유사한 방식으로 문제가 발생함을 밝혀낸 연구다.

도로교통 표지판(왼쪽)에 스프레이 흔적이 있어도 사람은 이를 다른 신호로 인식하지 않는다. 하지만 인공지능 이미지 인식모델은 표지판에 오인을 유도할 수 있는 스티커(오른쪽)를 붙이면 ‘정지’ 표지판을 ‘속도제한 45마일’로 인식하는 오류를 나타냈다. 이를 인공지능의 ‘적대적 사례’라고 말한다. arXiv.org 제공.

이 연구는 시리, 알렉사, 구글 홈 등 인공지능의 음성 기반 자연어 처리 시스템 적용이 확산되고 있는 상황에서 시스템이 내세우는 높은 정확도에도 불구하고 사소한 공격에도 매우 취약하다는 것을 보여준다는 점에서 의미가 있다. 현재 대부분의 소셜미디어와 이메일 등 인터넷 콘텐츠 서비스에서는 스팸, 불법광고, 음란물, 혐오표현 등 문제 내용을 인공지능 자연어 처리 시스템에 의존해 걸러내고 있는 상황이다. 자연어 처리시스템을 먹통으로 만들 수 있는 ‘적대적 사례’의 개발은 두 가지 가능성을 동시에 제시한다. 하나는 적대적 사례 공격에 취약한 인공지능 자연어 처리 시스템이 신뢰도를 잃어버릴 가능성이다. 다른 하나는 자연어 처리 시스템을 적대적 사례를 이용한 공격에 대비하도록 훈련시켜, 더 정확도 높고 안정적인 시스템을 구축할 수 있다는 점이다.

구본권 선임기자 starry9@hani.co.kr

연재구본권의 사람과 디지털

항상 시민과 함께하겠습니다. 한겨레 구독신청 하기

언론 자유를 위해, 국민의 알 권리를 위해
한겨레 저널리즘을 후원해주세요

후원하기 후원제 소개

한겨레와 친구하기

매일 아침, 매주 목요일 낮 뉴스의 홍수에서 당신을 구할 친절한 뉴스레터를 만나보세요
데일리H:730 구독 위클리h_weekly 구독
한겨레 공식 인스타그램
Follow @hanitweet
전체기사RSS RSS페이지 목록
한겨레앱

1/ 2/ 3

전체
정치	정치일반 대통령실 국회·정당 행정·자치 국방·북한 외교 정치BAR
사회	사회일반 여성 노동 환경 장애인 인권·복지 의료·건강 미디어 궂긴소식 인사 엔지오 교육 종교
전국	전국일반 제주 호남 영남 충청 강원 수도권
경제	경제일반 금융·증권 산업·재계 자동차 부동산 쇼핑·소비자 IT 직장·취업 중기·스타트업 기업PR 글로벌워치
국제	국제일반 해외토픽 아시아·태평양 미국·중남미 유럽 중국 일본 중동·아프리카 국제기구·회의 국제경제
문화	문화일반 영화·애니 방송·연예 여행·여가 음악·공연·전시 학술 책&생각
스포츠	스포츠일반 축구·해외리그 야구·MLB 골프 바둑 스포츠 특집 경기일정 경기결과
미래과학	미래 과학 기술 환경 시각
애니멀피플	야생동물 반려동물 농장동물 인간과동물 생태와진화
기후변화&	기후정책 기후행동 기후과학 기후적응 에너지와기후 기후와사회
휴심정	마음산책 조현이 만난 사람 휴심정 뉴스
오피니언	사설 칼럼 왜냐면
만화 \| ESC \| 한겨레S \| 연재 \| 이슈 \| 함께하는교육 \| HERI 이슈 \| 서울&
포토	화보
한겨레TV	편성표 한겨레TV 소개 광고·후원 문의 전체 프로그램
뉴스서비스	많이본기사 날짜별한겨레 지난톱기사 디지털초판 RSS서비스 기사제보 기사투고
매거진	한겨레21 씨네21 이코노미인사이트

전체

정치