학습데이터 많지 않아도 전처리만 잘 해서 먹이면 썩 괜찮은 결과가 나옴

대략 2분 내외의 길이로도 특징적인 습관들 잘 잡아서 가끔은 진짜랑 전혀 구분이 안되기도 함

노이즈 없고 또렷하게 들리는 음성만 잘 가져오기만 하면 돼서

모 대게이가 통화녹음 2시간 가량 모아둔 거 잘만 처리하면 아예 전혀 구분 안되게 파인 튜닝 가능할듯