구글닷오르그(Google.org)와 남캘리포니아대학이 딥러닝 방식의 인공지능을 활용해 공동개발한 영화 내용 분석 도구. 이 도구를 활용하면 그동안 사람이 수작업으로 해오던 배역의 성별과 대사 여부, 중요도 등의 분석 작업을 인공지능을 활용해 손쉽고 빠르게 처리할 수 있다. 영화 <히든 피겨스>의 한 장면을 인공지능이 분석하는 사진. 구글 제공
인공지능 기술이 현실화함에 따라 혜택과 함께 부작용도 드러나고 있다.
인공지능은 심화신경망 방식의 기계학습을 통해 비약적 발전을 거듭하고 있다. 사람이 처리하기 어려웠던 방대한 양의 비구조적인 데이터를 신속하게 분류하고 인식하는 기능을 통해 다양한 분야에서 괄목할 만한 성과를 이뤄내고 있다. 인공지능은 태그를 달아주지 않은 사진 더미에서 고양이 사진이나 특정한 내용을 식별하고 사진이나 동영상의 내용을 실시간으로 인식해 적절한 설명을 달 수 있는 기능을 선보였다. 구글의 알파고와 자동번역은 바둑·통역처럼 고도의 인간 능력으로 여겨져온 영역도 기계학습의 무풍지대가 아님을 일깨웠다.
인공지능은 사람이 구체적으로 작동 단계마다 실행 방법을 통제하거나 지시할 수 없기 때문에 차별과 편견을 강화하는 도구가 될 수 있다는 우려다. 마이크로소프트가 2016년 내놓은 인공지능 채팅로봇 테이는 나치즘과 인종차별주의자들의 도구가 되어 출시되자마자 막말을 쏟아내다가 퇴출당했다. 구글의 자동 사진분류 기능은 흑인 여성을 고릴라로 식별하는 실수를 해서 사과했다.
유럽로봇연구네트워크(EURON)는 로봇 윤리 가이드라인을 만들면서 로봇에 의한 ‘차별과 낙인화’를 금지할 것을 제안했다. 마이크로소프트의 최고경영자 사티아 나델라도 2016년 6월 <슬레이트> 기고를 통해서 인공지능 6원칙을 제시했는데, “인공지능은 차별 또는 편견을 방지해야 한다”는 게 그중 하나다. 인공지능에 의한 차별과 편견을 경계해야 하는 것은 인공지능이 알고리즘과 데이터를 기반으로 작동하는 기술 구조 때문이다. 알고리즘은 개발자의 사고방식과 편견을 반영하고, 학습 대상 데이터의 속성과 한계를 드러내기 때문이다. 인공지능 개발자들의 인구통계적 속성상 백인, 남자, 고소득층, 영어 사용자 위주의 편향이 만들어진다는 지적이 있다.
인공지능의 이러한 부작용에 대처하는 경로는 크게 두 가지다. 하나는 알고리즘과 데이터에 대한 투명성과 접근성을 높여, 관련 기업과 기술 전문가들이 설계한 것을 시민사회가 공적 관점에서 검토할 수 있도록 하는 길이다. 또 다른 경로는 데이터가 반영하는 현실 자체를 바꾸는 길이다.
최근 미국 영화계에서는 인공지능을 활용해 왜곡된 현실을 데이터의 형태로 드러내고 문제를 개선하려는 시도가 눈길을 끌고 있다. <델마와 루이스> 등에 출연한 영화배우이자 여권운동가인 지나 데이비스는 할리우드의 성차별을 줄이기 위한 작업에 인공지능을 적극 활용해 효율성을 높이고 있다.
지나 데이비스는 여러 해 전 자신의 어린 딸이 즐겨 보는 영화는 물론 애니메이션의 동물마저 남성 배역이 압도적으로 많다는 것을 발견했다. 그는 할리우드 영화가 사회 내 여성 역할을 경시하거나 왜곡하는 편견을 조장할 수 있다며 개선 운동에 뛰어들었다. 영화는 많은 영향을 끼친다. 미국에서는 2012년 여학생들의 양궁 배우기 열풍이 일었는데, 70%의 학생이 영화 <헝거 게임>과 <메리다와 마법의 숲>의 여주인공 캣니스와 메리다의 영향 때문이라고 답했다. 지나 데이비스는 2007년 ‘지나 데이비스 미디어젠더연구소’를 설립하고, 영화와 드라마에서 남녀 배우의 출연 시간과 대사 분량, 역할과 대화의 중요도 등을 분석해 이를 지수화하는 작업을 해왔다. ‘지나 데이비스 포용 지수’(GD-IQ)이다. 하지만 영화 한편 한편을 시청하면서 각 배역들의 대사와 역할을 데이터로 만드는 지수화 작업은 많은 노동력이 들어가고 엄밀성이 떨어졌다. 엄청난 시간과 비용이 요구됐다.
지나 데이비스 포용 지수(GD-IQ)가 미국 흥행 100대 영화를 대상으로 분석한 결과, 공포영화 장르에서만 여성 배역의 역할이 남성보다 많은 것으로 나타났다.
이 연구소는 남캘리포니아대학, 구글 글로벌임팩트챌린지와 함께 영화 내용 분석에 기계학습을 활용하는 방법을 도입해 지난해부터 다양한 연구결과를 내놓고 있다.
연구소가 2014년부터 3년간 미국에서 흥행 100위까지 영화를 분석한 결과, 여성들의 출연 분량과 대사 분량은 남성의 절반 수준인 35%, 36%로 나타났다. 장르별로 분석한 결과, 대부분의 장르에서 남성의 출연 시간과 대사가 많았고 ‘공포영화’ 장르에서만 여성의 출연 시간이 남성보다 많았다. 지나 데이비스는 이런 분석결과를 할리우드의 영화 제작자, 작가, 배우들에게 제공했다. 이를 통해 기존 작업 과정에서 의식하지 않았던 편견을 깨닫는 결과로 이어지기를 겨냥한 것이다. 지나 데이비스는 구글과의 인터뷰에서 “인공지능을 활용한 분석이 기존에 비해 혁명적 효율성을 가져왔다”며 “무의식적인 편견을 드러내는 데 있어 데이터가 가장 강력한 도구라는 것을 확인했다”고 말했다. 데이비스는 이 지수 공개 덕분에 영화 제작자들의 인식이 달라지고 있다며 5~10년 뒤엔 할리우드 영화에서 여성 배역의 분량과 중요도가 개선될 것이라고 기대하고 있다.
인공지능 기술은 데이터가 특정 계층의 속성과 이해를 지나치게 반영해 편견과 차별을 강화할 수 있다는 우려를 안고 있지만 동시에 잠재해 있던 차별 요소를 드러내 현실을 개선하는 수단으로 활용될 수도 있다. 지나 데이비스의 시도가 알려주는 것은 기술은 기업과 기술자들만의 노력으로 인간화되는 게 아니라, 해당 기술을 어떤 목적으로 쓰려고 하는가 하는 기술자 아닌 사람들의 노력과 의지를 통해서 더 나은 도구가 될 수 있다는 점이다.
구본권 사람과디지털연구소장
starry9@hani.co.kr