코신스키 “정확도 72%…사람보다 훨씬 높아”
2017년 동성애자 구별 AI 이어 또 논란 불러
2017년 동성애자 구별 AI 이어 또 논란 불러
얼굴 인식 알고리즘을 둘러싼 논란이 끊이지 않고 있다. 픽사베이
얼굴 사진에서 정치 성향을 판별하는 알고리즘의 진행 절차. 사이언티픽 리포츠
“유사과학적 연구” “우연보다 조금 나은 정도” 비판 코신스키는 이 예측 알고리즘을 적용해 본 결과, 정확도가 72%로 나타났다고 밝혔다. 이는 우연히 맞을 확률 50%보다 훨씬 높은 것이며, 일반적인 인간의 예측 정확도 55%, 또는 100개항 설문을 토대로 한 예측 정확도 66%보다도 높은 것이라고 그는 설명했다. 이용자들의 소속 국가(미국 영국 캐나다)나 사용 환경(페이스북, 데이트 웹사이트)에 관계없이 정확도는 비슷했다. 나이, 성, 인종에 따른 변수를 제거해도 정확도는 69%로 비교적 높았다고 그는 덧붙였다. 코신스키는 자칭 진보주의자는 카메라를 정면에서 바라보며 사진을 찍는 경향이 더 강하며 놀라운 표정을 짓거나 크게 웃는 경우가 많다는 등 몇몇 일시적 얼굴 특징을 통한 판별법도 있지만 이 방법의 정확도는 50%대로, 얼굴 인식 알고리즘에 비하면 크게 떨어진다고 밝혔다. 하지만 이런 연구는 유사과학적 아이디어에 기반한 것이라는 비판에 직면했다. 프린스턴대의 알렉산더 토도로프 교수(심리학)는 `벤처비트' 인터뷰에서 얼굴 인식 논문이 이용하는 방법론은 기술적으로 결함이 있다고 비판했다. 그는 수백만개의 사진을 비교하는 알고리즘이 골라낸 패턴은 실제 얼굴 특성과는 거의 관계가 없을 수 있다고 말했다. 예컨대 이용자들이 데이트 웹사이트에 올린 사진들에는 얼굴 이외의 요소들도 많이 포함돼 있다는 것이다. 프로필 사진을 기반으로 개인 성향을 예측하는 연구를 해온 대니얼 프레오티욱-피트로(Daniel Preotiuc-Pietro) 펜실베이니아대 박사후 연구원은 `비즈니스 인사이더' 인터뷰에서 “사진을 통해 개인 성향을 예측하는 것은 가능한 얘기이긴 하지만, 이는 기껏해야 우연히 맞출 확률보다 조금 나은 수준”이라고 말했다.
일상 곳곳의 카메라 장치들이 수집한 이미지는 얼굴 인식 알고리즘의 데이터로 활용된다. 픽사베이
“프라이버시·시민 자유 위험 경고하려는 것” 코신스키는 따가운 눈총에도 왜 굳이 이런 문제적 연구들을 계속하는 걸까? 그는 자신의 연구는 프라이버시 문제에 대한 경종을 울리기 위한 것이라고 항변한다. 그는 2018년 `복스'와의 인터뷰에서 자신의 가장 중요한 목표는 “디지털 발자국(digital footprints)이라는 렌즈를 통해 사람과 사회 과정, 행동을 이해하려는 것”이라고 주장한 바 있다. 그는 “많은 디지털 발자국이 정치적 지향을 비롯한 인간 내면의 특성을 드러내고 있는데, 그 중에서도 얼굴 인식은 상대방의 동의나 지식 없이도 이용될 수 있다. 얼굴 이미지는 법 집행 기관이 쉽게 (그리고 은밀하게) 촬영하거나 소셜 네트워크, 데이트 플랫폼, 사진 공유 웹사이트 및 정부 데이터베이스를 포함한 디지털 또는 아날로그 자료집에서 쉽게 확보할 수 있다.”고 말했다. 기업들과 정부가 이미 자신이 개발한 것과 비슷한 얼굴 인식 알고리즘을 사용하고 있으며, 실제 이를 보여줌으로써 이해당사자들에게 프라이버시 침해 문제를 경고할 필요가 있다는 것이 자신의 연구를 둘러싼 논란에 대한 그의 해명이다. 그는 이번 논문에서도 “얼굴 인식 기술의 광범위한 사용으로 프라이버시와 시민 자유에 큰 위험이 초래되고 있다”며 “그 위험이 여러 면에서 전례없는 수준”이라고 주장했다. 그러나 비판자들은 명분이 그럴싸 하더라도 악용, 오용될 수 있는 것을 연구하는 것 자체가 위험한 행위라고 말한다. 워싱턴대 오스 키예스(Os Keyes) 박사과정 연구원(인공지능)은 `벤처비트' 인터뷰에서 얼굴 인식의 오용과 결함에 주의를 기울이는 것이 중요하다는 코신스키의 주장에 동의하지만, 코신스키류의 연구는 기본적으로 정크 과학(junk science)을 발전시키는 행위라고 비판했다. 코신스키가 이런 의심과 비판을 받는 데는 그의 전력도 한몫한다. 그는 2013년 케임브리지대학 연구원으로 일할 당시 동료들과 함께 페이스북에서 온라인 성격 테스트를 통해 집계한 정보와 좋아요 데이터 등을 이용해 개인의 피부색, 성별, 성적 지향, 정치적 성향을 예측하는 논문을 발표했다. 2016년 도널드 트럼프 대통령 후보에게 선거 컨설팅을 해준 것으로 알려진 빅데이터 전문업체 케임브리지 애널리티카는 그의 방법론을 이용해 페이스북 이용자 데이터를 수집해 선거전략을 수립하는 데 활용했다. 당시 수천만건의 개인정보 유출이 큰 파문을 일으키면서 이 회사는 경영 악화에 접어들었고, 이후 2018년 결국 파산을 선언했다. 곽노필 선임기자 nopil@hani.co.kr, ▶곽노필의 미래창 바로가기
항상 시민과 함께하겠습니다. 한겨레 구독신청 하기