딥러닝 음성인식

MFCC (Mel-Frequency Cepstral Coefficient)
- 음성인식에서 가장 많이 쓰이는 파라미터
- 소리의 고유한 특징 나타내는 수치
- Mel Spectrum 에서 Cepstral 분석을 통해 추출된 값
- 용도 : 음성인식, 화자인식, 음성합성, 음악 장르 분류 등의 문제 해결
스펙트럼 (spectrum)
- 신호 - Sampling+Windowing - FFT - Log power spectrum density -> spectrum
cepstrum : spectrum에서 spec 을 거꾸로 해서 만든 단어
- 신호에 고속 푸리에 변환 적용 : spectrum 구함
- spectrum 에서 역방향 고속 푸리에 변환 (Inverse FFT) 적용 : cepstrum 구함

딥러닝의 역사 (0)	2021.04.08
딥러닝 이해 (0)	2021.04.07
딥러닝 - CNN (Convolutional Neural Network) (0)	2021.04.07
딥러닝 - CNN (Convolutional Neural Network) (0)	2021.04.07
CNN(Convolutional Neural Network) (0)	2021.03.29

gogo