반응형
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- agnoster폰트
- pytorch
- iterm2환경설정
- GAN
- agnoster폰트깨짐
- 캐나다 TD 한국인 예약
- iterm2자동완성
- 콘도렌트
- 터미널꾸미기
- 캐나다 은행 계좌 개설
- 프라이탁 존버
- 캐나다콘도렌트
- 캐나다 은행계좌 개설
- MachineLearning
- GenerativeModel
- Generative model
- iterm2꾸미기
- Normalizing flow
- Flow
- agnoster폰트꺠짐
- 머신러닝
- 프라이탁
- 캐나다월세
- 딥러닝
- 캐나다 TDBAnk
- Docker
- 캐나다 TD 예약
- EATS
- DTW
- 캐나다 TD 한국인 직원 예약
Archives
- Today
- Total
목록음성처리 (1)
TechNOTE
Mel spectrogram 설명
음성 데이터를 raw data를 그대로 사용하면 파라미터가 너무 많아지기도 하고 데이터 용량이 너무 커지므로 보통 mel spectrogram을 많이 사용한다. 이게 뭔지 제대로 알아보도록 하자! 1. 음성파일 로드 sampling rate 24000 으로 구성된 wav 파일을 로드해 보면 다음과 같다. sampling rate가 24000이라는 말은 1초에 음성 신호를 24000번 sampling 했다는 뜻이다. 2.STFT(Short Time Fourier Transform) 이 데이터에, STFT(Short Time Fourier Transform)를 해 준다. STFT란 뭘까? 그 전에 푸리에변환이 뭔지부터 보자.. 푸리에 변환? (Fourier Transform) www.youtube.com/w..
음성
2020. 11. 20. 12:00