반응형
- MFCC (Mel-Frequency Cepstral Coefficient)
- 음성인식에서 가장 많이 쓰이는 파라미터
- 소리의 고유한 특징 나타내는 수치
- Mel Spectrum 에서 Cepstral 분석을 통해 추출된 값
- 용도 : 음성인식, 화자인식, 음성합성, 음악 장르 분류 등의 문제 해결
- 스펙트럼 (spectrum)
- 신호 - Sampling+Windowing - FFT - Log power spectrum density -> spectrum
- cepstrum : spectrum에서 spec 을 거꾸로 해서 만든 단어
- 신호에 고속 푸리에 변환 적용 : spectrum 구함
- spectrum 에서 역방향 고속 푸리에 변환 (Inverse FFT) 적용 : cepstrum 구함
반응형
'딥러닝 (Deep Learning)' 카테고리의 다른 글
딥러닝의 역사 (0) | 2021.04.08 |
---|---|
딥러닝 이해 (0) | 2021.04.07 |
딥러닝 - CNN (Convolutional Neural Network) (0) | 2021.04.07 |
딥러닝 - CNN (Convolutional Neural Network) (0) | 2021.04.07 |
CNN(Convolutional Neural Network) (0) | 2021.03.29 |