수사 인력을 대상으로 국립과학수사연구원과 통합데이터분석센터가 새로 개발한 음성분석모델을 설명하는 박남인 연구사. 박다해 기자
“두 음성의 유사도가 낮아서 같은 사람인지 아닌지 판별이 어려운 음성 파일도 비교해서 들어볼 수 있을까요?”
지난 11일 강원도 원주의 국립과학수사연구원(국과수). 대검찰청·경찰청·국방부·경찰대 등에서 온 20명이 넘는 수사 인력이 한데 모였다. 국과수와 행정안전부 통합데이터분석센터가 공동개발한 ‘보이스피싱 음성분석모델’을 실제로 수사에 어떻게 접목할 수 있을지 처음 교육을 받는 자리였다. 박남인 국과수 디지털과 연구사가 해당 프로그램을 활용해 목소리 간 유사도를 판별하는 시연을 해보이자, 교육생들 사이에서 질문이 앞다퉈 나왔다.
한국형 음성분석모델 프로그램은 박남인 연구사가 2015년부터 업무 외 시간까지 투자해 만들어낸 최초의 프로그램이다. 지난해부터는 통합데이터분석센터와 협업했고 올해 개발을 완료했다. 그동안 국과수는 러시아와 영국에서 개발한 음성분석모델을 써왔는데 외국어로 학습된 모델 특성상 한국어를 사용하는 범죄자의 목소리 유사도를 판별하는 데 한계가 있었다. 인공지능 학습 기술을 활용해 탄생한 이번 모델은 그동안 사용해온 모델보다 판독률이 77%가량 높고, 분석 속도도 빨라졌다. 박 연구사는 “350개가량의 보이스피싱 파일을 분석하는 데 30초가 채 안 걸린다”고 설명했다.
세계 최초로 탑재된 기능도 있다. 바로 한 보이스피싱 범죄에 2명 이상이 가담했을 경우, 목소리를 따로 분리한 뒤 각 가담자가 참여한 다른 범죄의 음성 파일과 대조해 유사도를 분석하는 기능이다. 예컨대 한 보이스피싱 전화에 수사관 역을 맡은 ㄱ과 검사 역을 맡은 ㄴ이 동시에 있는 경우 이 기능을 활용하면 ㄱ과 ㄴ이 따로 가담한 다른 범죄는 무엇이 있는지, 이들이 소속돼 함께 움직이는 그룹에 누가 속해 있는지를 밝혀낼 수 있다. 같은 범죄그룹의 구성원들을 한데 묶고 관계도를 만드는 게 가능해진다.
전옥엽 국과수 디지털과 연구관은 “범죄를 저지를 때 ㄱ과 ㄴ 둘만 쌍을 이뤄서 하는 게 아니다. ㄱ과 ㄷ, ㄴ과 ㄹ 등 여러 인원이 역할을 나눠 보이스피싱 범죄에 가담한 경우 (이 모델을 이용하면) ㄱ·ㄴ·ㄷ·ㄹ 네명 모두의 상관관계를 확인할 수 있다”고 설명했다. 실제로 국과수는 이 방법을 활용해 범죄 연루자 5531명의 음성을 구분해 분석한 결과 총 235개 조직에서 633명이 활동하고 있다는 점을 밝혀낸 바 있다.
행정안전부는 오는 9월부터 전국 경찰이 이 분석모델을 수사 현장에서 쓸 수 있도록 도입하겠다고 밝혔다. 이날 교육을 들은 충남경찰청의 안정엽 경위는 “(음성을) 먼저 들어도 수사관 이야기만으론 강제성 있는 수사를 진행하기엔 부족하다”며 “이때 가장 먼저 하는 게 국과수에 음성 분석을 의뢰하는 거였는데, 이번 프로그램이 도입돼 수사관도 직접 유사도를 확인할 수 있다면 수사가 더욱 신속하게 진행될 것으로 보인다”고 말했다.
다만 보급형 모델이 ‘범죄자 그룹화’까지 가능한 버전이 아니라 음성 ‘일대일 유사도 분석’ 기능만 탑재하고 있다 보니, 실제로 보이스피싱범을 검거하기 위해선 더 많은 기능이 있어야 한다는 목소리도 있다. 한 교육생은 “피싱범들은 불특정 다수를 대상으로 여러 건의 통화를 하기 때문에 데이터베이스에 있는 다수의 음성 파일과 신규 음성 파일 중 일치되는 파일을 찾아낼 수 있는 ‘일대다’ 분석 기능이 필요하다”고 말했다.
박다해 기자
doall@hani.co.kr