현 시점, 화자 구분 문제점
Cori
화자 구분 고도화 관련 내용을 지난 포스트에서 다루었으며, 이후 화자 구분을 실질적으로 적용해보며 겪고 있는 문제점들을 여기서 다뤄본다. API를 이용한 화자 구분 보다는 성능이 많이 좋아지긴 했지만, 여전히 개선해야 할 부분들이 여럿 있다. 그러면 바로 시작해보자 0. 실제 API 보다 성능이 좋아졌는가 ?화자 구분 고도화 파이프라인은 다음과 같으며, 각 단계별로 개선할 수 있어 보이는 부분들을 고도화하여 로컬에서 사용 가능한 화자 구분 모델을 구축했다(Segmentation, Embedding 모델은 Pyannote과 Wespeak 모델 사용, 이전 포스트들에서 소개함).* 아직 청크별 화자 연결이 남아 있고, 이 과정을 진행하면서 발견한 문제점이라, 이 부분은 아래에서 추가적으로 다룬다. 잡음이 ..