본문 바로가기

광고

광고닫기

광고

본문

광고

미래&과학 기술

얼굴 사진으로 진보·보수 판별하는 인공지능은 누가 좋아할까

등록 2021-01-19 11:16수정 2021-01-19 15:43

코신스키 “정확도 72%…사람보다 훨씬 높아”
2017년 동성애자 구별 AI 이어 또 논란 불러
얼굴 인식 알고리즘을 둘러싼 논란이 끊이지 않고 있다. 픽사베이
얼굴 인식 알고리즘을 둘러싼 논란이 끊이지 않고 있다. 픽사베이
2017년 동성애자를 판별하는 얼굴 인식 인공지능 연구 결과를 발표해 논란의 중심에 섰던 미국 스탠퍼드대 미하우 코신스키(Michal Kosinski) 교수(조직행동학)가 또 하나의 논란거리를 내놨다.

그가 이번엔 기존의 오픈소스 알고리즘을 이용해 얼굴 인식 기술로 개인의 정치 성향을 판별할 수 있다는 연구 결과를 발표했다. `얼굴 인식 기술은 자연스런 얼굴 사진에서 정치 성향을 드러낼 수 있다'는 것이 그가 1월11일 국제학술지 `사이언티픽 리포츠'에 발표한 1인 논문의 제목이다. 인공지능이 정치 구호 등이 적힌 모자나 티셔츠 같은 도구 없이도 얼굴 사진만 보고 그 사람이 진보 성향인지, 보수 성향인지 알아낼 수 있다는 것이다.

2017년 동성애 알고리즘 발표 직후 시작한 이번 연구에서 그는 미국과 영국, 캐나다의 온라인 데이트 웹사이트와, 지금은 서비스가 중단된 `마이퍼스낼리티' 앱의 페이스북 프로필에서 모두 108만여명의 얼굴 사진을 수집했다. 이 웹사이트와 앱 등록자들은 자신의 정치 성향을 함께 표시해 놓았다.

그는 이들의 얼굴 사진을 얼굴 인식 알고리즘에 집어넣고 각각의 얼굴 특징을 대략 2000가지의 데이터 요소들로 압축시켰다. 여기서 데이터 요소란 눈썹 색깔, 코 모양처럼 사람 눈에 보이는 직관적인 것이 아니라 컴퓨터 고유의 개념이다. 코신스키는 이런 식으로 사진에서 수집한 데이터를 알고리즘에 입력한 뒤, 진보 또는 보수 성향에 연결될 수 있는 공통 요소들을 추출해 이를 예측 플랫폼으로 만들어냈다.

얼굴 사진에서 정치 성향을 판별하는 알고리즘의 진행 절차. 사이언티픽 리포츠
얼굴 사진에서 정치 성향을 판별하는 알고리즘의 진행 절차. 사이언티픽 리포츠
_______
“유사과학적 연구” “우연보다 조금 나은 정도” 비판

코신스키는 이 예측 알고리즘을 적용해 본 결과, 정확도가 72%로 나타났다고 밝혔다. 이는 우연히 맞을 확률 50%보다 훨씬 높은 것이며, 일반적인 인간의 예측 정확도 55%, 또는 100개항 설문을 토대로 한 예측 정확도 66%보다도 높은 것이라고 그는 설명했다. 이용자들의 소속 국가(미국 영국 캐나다)나 사용 환경(페이스북, 데이트 웹사이트)에 관계없이 정확도는 비슷했다. 나이, 성, 인종에 따른 변수를 제거해도 정확도는 69%로 비교적 높았다고 그는 덧붙였다.

코신스키는 자칭 진보주의자는 카메라를 정면에서 바라보며 사진을 찍는 경향이 더 강하며 놀라운 표정을 짓거나 크게 웃는 경우가 많다는 등 몇몇 일시적 얼굴 특징을 통한 판별법도 있지만 이 방법의 정확도는 50%대로, 얼굴 인식 알고리즘에 비하면 크게 떨어진다고 밝혔다.

하지만 이런 연구는 유사과학적 아이디어에 기반한 것이라는 비판에 직면했다. 프린스턴대의 알렉산더 토도로프 교수(심리학)는 `벤처비트' 인터뷰에서 얼굴 인식 논문이 이용하는 방법론은 기술적으로 결함이 있다고 비판했다. 그는 수백만개의 사진을 비교하는 알고리즘이 골라낸 패턴은 실제 얼굴 특성과는 거의 관계가 없을 수 있다고 말했다. 예컨대 이용자들이 데이트 웹사이트에 올린 사진들에는 얼굴 이외의 요소들도 많이 포함돼 있다는 것이다.

프로필 사진을 기반으로 개인 성향을 예측하는 연구를 해온 대니얼 프레오티욱-피트로(Daniel Preotiuc-Pietro) 펜실베이니아대 박사후 연구원은 `비즈니스 인사이더' 인터뷰에서 “사진을 통해 개인 성향을 예측하는 것은 가능한 얘기이긴 하지만, 이는 기껏해야 우연히 맞출 확률보다 조금 나은 수준”이라고 말했다.

일상 곳곳의 카메라 장치들이 수집한 이미지는 얼굴 인식 알고리즘의 데이터로 활용된다. 픽사베이
일상 곳곳의 카메라 장치들이 수집한 이미지는 얼굴 인식 알고리즘의 데이터로 활용된다. 픽사베이
_______
“프라이버시·시민 자유 위험 경고하려는 것”

코신스키는 따가운 눈총에도 왜 굳이 이런 문제적 연구들을 계속하는 걸까?

그는 자신의 연구는 프라이버시 문제에 대한 경종을 울리기 위한 것이라고 항변한다. 그는 2018년 `복스'와의 인터뷰에서 자신의 가장 중요한 목표는 “디지털 발자국(digital footprints)이라는 렌즈를 통해 사람과 사회 과정, 행동을 이해하려는 것”이라고 주장한 바 있다. 그는 “많은 디지털 발자국이 정치적 지향을 비롯한 인간 내면의 특성을 드러내고 있는데, 그 중에서도 얼굴 인식은 상대방의 동의나 지식 없이도 이용될 수 있다. 얼굴 이미지는 법 집행 기관이 쉽게 (그리고 은밀하게) 촬영하거나 소셜 네트워크, 데이트 플랫폼, 사진 공유 웹사이트 및 정부 데이터베이스를 포함한 디지털 또는 아날로그 자료집에서 쉽게 확보할 수 있다.”고 말했다. 기업들과 정부가 이미 자신이 개발한 것과 비슷한 얼굴 인식 알고리즘을 사용하고 있으며, 실제 이를 보여줌으로써 이해당사자들에게 프라이버시 침해 문제를 경고할 필요가 있다는 것이 자신의 연구를 둘러싼 논란에 대한 그의 해명이다. 그는 이번 논문에서도 “얼굴 인식 기술의 광범위한 사용으로 프라이버시와 시민 자유에 큰 위험이 초래되고 있다”며 “그 위험이 여러 면에서 전례없는 수준”이라고 주장했다.

그러나 비판자들은 명분이 그럴싸 하더라도 악용, 오용될 수 있는 것을 연구하는 것 자체가 위험한 행위라고 말한다. 워싱턴대 오스 키예스(Os Keyes) 박사과정 연구원(인공지능)은 `벤처비트' 인터뷰에서 얼굴 인식의 오용과 결함에 주의를 기울이는 것이 중요하다는 코신스키의 주장에 동의하지만, 코신스키류의 연구는 기본적으로 정크 과학(junk science)을 발전시키는 행위라고 비판했다.

코신스키가 이런 의심과 비판을 받는 데는 그의 전력도 한몫한다. 그는 2013년 케임브리지대학 연구원으로 일할 당시 동료들과 함께 페이스북에서 온라인 성격 테스트를 통해 집계한 정보와 좋아요 데이터 등을 이용해 개인의 피부색, 성별, 성적 지향, 정치적 성향을 예측하는 논문을 발표했다. 2016년 도널드 트럼프 대통령 후보에게 선거 컨설팅을 해준 것으로 알려진 빅데이터 전문업체 케임브리지 애널리티카는 그의 방법론을 이용해 페이스북 이용자 데이터를 수집해 선거전략을 수립하는 데 활용했다. 당시 수천만건의 개인정보 유출이 큰 파문을 일으키면서 이 회사는 경영 악화에 접어들었고, 이후 2018년 결국 파산을 선언했다.

곽노필 선임기자 nopil@hani.co.kr, ▶곽노필의 미래창 바로가기
항상 시민과 함께하겠습니다. 한겨레 구독신청 하기
언론 자유를 위해, 국민의 알 권리를 위해
한겨레 저널리즘을 후원해주세요

광고

광고

광고

미래&과학 많이 보는 기사

중국 ‘우주굴기’ 덕에…마침내 벗겨지는 달 뒷면의 비밀 1.

중국 ‘우주굴기’ 덕에…마침내 벗겨지는 달 뒷면의 비밀

울릉도는 활화산, 백두산과 동일한 화산가스 나온다 2.

울릉도는 활화산, 백두산과 동일한 화산가스 나온다

우주는 얼마나 어두울까…뉴허라이즌스 통해 계산해보니 3.

우주는 얼마나 어두울까…뉴허라이즌스 통해 계산해보니

첫눈 폭설에 하얗게 된 한반도…우주서 바라봤더니 4.

첫눈 폭설에 하얗게 된 한반도…우주서 바라봤더니

“동물실험 대체하는 컴퓨터, 화학독성 예측 정확도 더 높아” 5.

“동물실험 대체하는 컴퓨터, 화학독성 예측 정확도 더 높아”

한겨레와 친구하기

1/ 2/ 3


서비스 전체보기

전체
정치
사회
전국
경제
국제
문화
스포츠
미래과학
애니멀피플
기후변화&
휴심정
오피니언
만화 | ESC | 한겨레S | 연재 | 이슈 | 함께하는교육 | HERI 이슈 | 서울&
포토
한겨레TV
뉴스서비스
매거진

맨위로
뉴스레터, 올해 가장 잘한 일 구독신청