세계 최초‘보이스피싱 음성분석 모델’개발
Feb. 23, 2023
글로벌 코리언 포스트
세계 최초로 전화사기 검거에 초점을 맞춘 ‘보이스피싱 음성분석 모델’이 개발되어 범죄 수사와 범죄자 검거에 속도가 붙게 될 것으로 기대된다.
행정안전부는 보이스피싱 사기범 검거에 활용할 수 있는 ‘보이스피싱 음성분석 모델’을 개발하고, 이달 말부터 음성 감정 등 사기범 수사 과정에 활용한다고 밝혔다.
그동안 국내에서는 국립과학수사연구원이 러시아와 영국에서 개발한 음성분석 모델을 활용하여 보이스피싱 수사에 필요한 음성감정을 진행해왔다.
하지만 외국어로 학습된 음성분석 모델 특성상, 한국어를 사용하는 범죄자의 동일인 여부를 판별하는 정확도에 한계가 있었다.
특히, 단일 범죄자의 음성 일치 여부 확인뿐 아니라 보이스피싱 범죄조직의 특성상 역할(수사관, 검사 등)을 나누어 그룹별로 활동하고 있어, 범죄에 연루된 범죄자들을 군집화하는 기능이 반드시 필요했으나 기존모델에는 이러한 기능이 없었다.
이에, 행정안전부 통합데이터분석센터는 국립과학수사연구원(이하 국과수)와 함께 지난해부터 보이스피싱 범죄자 검거에 초점을 두고 화자(話者) 구분 정확도 개선과 범죄연루자 그룹화가 가능한 모델 개발을 추진하였다.
최신 인공지능학습(AI 딥러닝) 기술을 활용하여 탄생한 이번 모델은, 개발과정에서 국내외 약 6,000여 명으로부터 추출한 100만 개 이상의 외국어와 한국어 음성데이터를 활용하였다.
특히 한국어의 경우, 약 10만 개 이상의 일반인 음성데이터와 국과수가 보유 중인 실제 보이스피싱 사기범 음성데이터를 함께 사용하여 다양한 학습 과정과 성능 검증과정을 반복 시행함으로써 보이스피싱 화자 구분 등에 필요한 최적의 알고리즘을 만들어 낼 수 있었다.
모델 개발 이후, 두 차례에 걸쳐 진행된 정확도 검증은 1차에서 150명 660여 개, 2차는 200명 12,000여 개의 별도 음성데이터를 사용하여 다양한 상황 가정하에 이루어졌다.
성능 검증결과, 범죄자의 음성을 정확하게 판별해내는 판독률이 기존 외산 분석모델 대비 약 77%* 향상된 것이 확인됐다.
* (예) 100개의 범죄자 음성 감정시, 기존모델에서는 목소리 동일성 여부를 28개 정도만 판별해 낼 수 있었지만, 새로운 모델에서는 51개까지 판별 가능
또한, 행정안전부 통합데이터분석센터는 기존 모델에서는 기대할 수 없었던 범죄가담자 그룹화 기능도 세계 최초로 구현할 수 있게 되었다고 밝혔다.