음성을 통해 화자의 감정을 인식할 수 있는 모델을 제작
- RAVDESS Dataset
- torch : 1.6.0
- torchaudio : 0.6.0
- 모든 음원은 고정길이를 가지고 있음
feature를 추출할때 사용할 기능들을 담고 있음
torchaudio 라이브러리를 사용해서 음원의 spectrogram을 추출
- source
- sample_rate
- n_fft : None (win_length와 동일)
- window_size : 0.025
- window_stride : 0.01
- Dimension (…, freq, time)
torchaudio 라이브러리를 사용해서 음원의 mel spectrogram을 추출
- source
- sample_rate
- n_mels : 80
- n_fft : None (win_length와 동일)
- window_size : 0.025
- window_stride : 0.01
- Dimension (…, freq, time)