말하는 AI 모델의 생성 과정
음성인식, 언어지능, 음성합성 순으로 연계 음성인식(Speech To Text) 핵심어 검출, 음성구간 검출, 인식(디코더)로 나뉜다. 핵심어 검출 https://ahnjg.tistory.com/66 핵심어 검출 (KWS, Keyword Spotting) 목차 핵심어 검출 (KWS, Keyword Spotting) 개요 발화자의 음성에서 핵심어를 검출하는 방법 발화자의 음성에서 특징 추출 음향 모델을 활용한 키워드 판별 카카오 미니의 핵심어 검출 엔진 1. 핵심어 ahnjg.tistory.com 1. 음성에서 특징 벡터(feature)을 추출한다. 멜 주파수 캡스트럼, 필터 뱅크 에너지 또는 지각 선형 예측 등 말하는 구간만 잘라 전달한다. 2. 해당 음성 구간이 키워드인지 아닌지를 파악 일반적인 음향 ..
데이터 사이언스 & 로봇/ML 및 DL 관련 이론
2024. 1. 31. 12:44