본문 바로가기

딥러닝 (Deep Learning)

딥러닝 음성인식

반응형
  • MFCC (Mel-Frequency Cepstral Coefficient) 
    • 음성인식에서 가장 많이 쓰이는 파라미터
    • 소리의 고유한 특징 나타내는 수치 
    • Mel Spectrum 에서 Cepstral 분석을 통해 추출된 값 
    • 용도 : 음성인식, 화자인식, 음성합성, 음악 장르 분류 등의  문제 해결
  • 스펙트럼 (spectrum)
    • 신호 - Sampling+Windowing - FFT - Log power spectrum density -> spectrum 
  • cepstrum : spectrum에서 spec 을 거꾸로 해서 만든 단어
    • 신호에 고속 푸리에 변환 적용 : spectrum 구함
    • spectrum 에서 역방향 고속 푸리에 변환 (Inverse FFT) 적용 : cepstrum 구함 
반응형

'딥러닝 (Deep Learning)' 카테고리의 다른 글

딥러닝의 역사  (0) 2021.04.08
딥러닝 이해  (0) 2021.04.07
딥러닝 - CNN (Convolutional Neural Network)  (0) 2021.04.07
딥러닝 - CNN (Convolutional Neural Network)  (0) 2021.04.07
CNN(Convolutional Neural Network)  (0) 2021.03.29