권일용 l 전 경정·범죄학 박사
2012년 4월 한 보험사는 서울지방경찰청 장기미제팀에 보험사기 의심 사건을 의뢰하였다. 40대 여성 안씨가 보험료를 두 달 입금한 후 갑자기 사망하여 안씨의 부모가 무려 33억원을 받게 되었는데 보험사기가 의심된다는 것이다. 수사팀이 확인해보니 안씨의 시신은 사망 후 장례식장에서 바로 다음날 화장을 하였으며, 부모는 심지어 딸이 사망한 것도 모르고 있었다. 보험사기를 직감한 수사팀은 사건 발생 두 달이 지날 무렵 안씨의 언니가 손에 휴대전화를 들고 있으면서도 지하철역 입구에서 공중전화를 거는 모습을 포착하였다. 수사팀은 즉시 상대방 신원을 확인하였고 불상의 남성이 몇 개월 전 휴대전화를 개통하고 도시가스를 설치해 달라고 공사에 요청한 사실을 밝혀낸다. 도시가스공사에는 당시 설치 요청을 하면서 통화한 내용이 남아 있었는데, 전화를 건 목소리는 남성이 아니라 여성의 목소리였던 것. 이 목소리를 사망한 안씨가 보험사와 통화할 당시에 남아 있던 목소리 파일과 비교해 성문(주파수 분석 장치를 이용해 음성을 줄무늬 그림으로 나타낸 것)이 같다는 것을 확인하고 사건의 실체를 밝히게 된다. 이 사건은 자신이 보험에 가입한 뒤 노숙자를 유인해 살해하고 자신으로 위장한 안씨가 언니와 남자친구, 보험설계사 등과 공모해 저지른 사건으로 밝혀졌다. 이 사건의 결정적 단서가 된 것이 성문이다.
형사 사법 분야에서 개인을 식별하는 디엔에이(DNA)나 지문 대조 같은 과학수사 기법은 날로 발전하고 있다. 이와 더불어 범죄 수사에서 범인을 특정할 때 음성을 분석해 개인을 식별하는 기법도 발전을 거듭하고 있다. 2017년 수사기관에서는 한국인 1000명의 음성을 토대로 ‘한국인 표본 음성 데이터베이스(DB)’를 구축했고, 국립과학수사연구원(국과수)은 이를 활용해 보이스피싱 사기범죄단을 검거하는 데 집중하고 있다. 영화 <그놈 목소리>로 알려진 이형호군 유괴 사건 당시 범인의 목소리도 디지털로 변환해 성문 분석을 하고 있다.
음성을 분석하는 기법은 1962년 미국 연방수사국(FBI)이 벨 연구소에 화자 식별에 관한 연구를 의뢰하면서 시작되었다. 목소리는 주파수 분석 장치에 의해 복잡한 스펙트로그램(소리나 파동을 시각화하는 도구)으로 나타난다. 목소리의 시각화가 가능하다는 것이다. 그리고 이것은 말하는 사람마다 다른 형상으로 나타나기 때문에 목소리로 사람을 구분하는 것이 가능하다. 사람마다 조음기관과 공명기관이 모두 다르고 언어적 습관에 따라 억양이나 성조 등이 다르기 때문에 가능한 일이다.
또한, 사람들은 상황에 따라서 음성의 고조, 속도, 떨림 정도 등이 다르다는 것에 착안해 최근 발전된 음성 분석은 심리 상태를 파악하는 자료로도 활용이 가능하다. 이를 바탕으로 용의자 심문 시 활용할 수 있는 음성 분석 프로그램도 개발되었다.
과거 음성 분석의 가장 큰 장애물은 시끄러운 장소에서 함께 녹음된 주변 ‘소음’을 걸러내는 것이었다. 이제 목소리와 함께 녹음된 소음은 음향 기술과 분석 프로그램의 개발로 해결이 가능해졌다. 녹음 파일을 디지털 파일로 변환해 복잡하게 혼합된 주파수를 대역별로 분리, 특정 대역을 증폭시킴으로써 음원을 분리하고 소음의 간섭을 줄일 수 있게 된 것이다. 최근에는 인공지능(AI)을 활용해 휴대전화의 스피커를 통해 음성이 입력되면 인공지능 심층신경망을 기반으로 데이터베이스에서 성문을 인식하고 화자를 분류한 후 다시 소음을 삭제해 화자를 분류하고 있다.
향후 과학수사는 성문 분석만으로도 용의자의 출신 지역, 연령, 학업 등을 다양한 요소로 추정할 정도로 발전을 거듭하고 있다. 끝없는 과학수사의 발전으로 미제 사건을 해결할 수 있기를 기대한다.