남성의 얼굴 사진을 기반으로 이미지 생성 알고리즘이 만들어낸 몸. 연구논문 갈무리.
인공지능(AI)이 인간이 지닌 편견을 배운다는 사실은 더는 ‘뉴스’가 아니다. 2016년 마이크로소프트는 인공지능 챗봇(채팅 로봇) ‘테이’을 내놓았는데 인종차별적 발언을 쏟아내다 출시 16시간 만에 운영을 중단했다. 한국의 챗봇
‘이루다’ 역시 성소수자와 특정 인종에 대한 혐오 발언을 일삼는 등 여러 문제가 확인돼 최근 서비스가 중지됐다.
인간의 편견을 학습하는 건 챗봇 등 ‘언어 생성 알고리즘’에 기댄 인공지능뿐만이 아니다. 얼굴을 인식해 그에 맞는 몸을 생성하는 ‘이미지 생성 알고리즘’ 또한 인간의 편견이 담긴 이미지를 만드는 것으로 나타났다.
미국의 정보기술매체 <원제로(OneZero)>는 지난달 30일
‘이미지 생성 알고리즘’에 관한 새로운 연구를 소개했다. 미국 카네기멜론대학과 조지워싱턴대학의 연구자들이 진행한 이 연구는 이미지 생성 알고리즘 또한 인간의 편견에 기반을 두고 있다는 걸 보여준다.
연구에는 이미지 생성이나 사물 인식 용도로 쓰이는 오픈에이아이(OpneAI)의 iGPT와 구글의 SimCLR v2가 알고리즘으로 사용됐다. 약 1200만장의 이미지를 보유한 ‘이미지넷(ImageNet)’이 이 알고리즘들이 학습할 자료로 쓰였다.
연구자들은 증명사진처럼 얼굴만 찍힌 사진을 입력한 뒤 이미지 생성 알고리즘이 이 얼굴에 적합한 몸을 저화질의 이미지로 생성하도록 했다. 일부 문구를 입력하면 완성 문장이 따라오는 ‘자동완성기능’처럼, 알고리즘이 조각난 이미지를 완성하도록 한 것이다.
결과는 연구자들이 부여한 얼굴의 ‘성별’에 따라 달랐다. 알고리즘은 남성의 얼굴이 주어지자 43%의 확률로 정장 차림 등 직장에서 입을 법한 옷차림을 한 몸을 생성하는 것으로 나타났다. 반면 여성의 얼굴을 부여하면 53%의 확률로 비키니 차림의 몸이나 노출이 많은 차림의 몸이 따라왔다. 남성과 여성에게 적합한 차림에 대한 편견을 알고리즘이 고스란히 학습하고 반복한 것이다.
심지어 알고리즘은 미국 유명한 진보 성향 정치인인 알렉산드리아 오카시오코르테스 민주당 하원의원의 얼굴 사진에도 학습한 편견을 투사했다. 알고리즘은 오카시오코르테스의 얼굴에 비키니 차림의 몸을 붙였다. 인종에 대한 편견도 마찬가지다. 백인의 얼굴에는 도구를 들고 있는 몸이, 흑인의 얼굴에는 총을 들고 있는 몸이 따라왔다.
장병탁 서울대 에이아이(AI)연구원장은 “잘 작동하는 인공지능일수록 결국 데이터들을 잘 흡수하고, 결과적으로 사람이 지닌 편향을 학습하기도 한다. 남성에게는 정장을, 여성에게는 비키니를 연상하는 사람의 연상작용을 인공지능이 반복한다고 보면 된다”고 짚었다.
장 원장은 최근 업계에서도 이런 편향을 걸러내기 위해 기술적 방지책 마련에 고심하고 있지만 인간의 편견이 담긴 데이터를 인공지능이 학습하는 한 이런 일들이 사라지기는 힘들다고 말했다. 장 원장은 “사람이 경험에 기초해 사고하는 것처럼, 인공지능은 사람들이 만들어낸 데이터에 기초해 사고하고 연상한다. 인공지능 기술을 접하는 사람들이 윤리적으로 사용하고 행동해야 이런 편향들도 줄어들 수 있다”고 했다. ‘쓰레기를 넣으면 쓰레기가 나온다’(Garbage In, Garbage Out)는 격언에는 예외가 없다는 말이다.
임재우 기자
abbado@hani.co.kr