반응형
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 캐나다 은행계좌 개설
- 터미널꾸미기
- 캐나다 은행 계좌 개설
- iterm2꾸미기
- 머신러닝
- iterm2자동완성
- Flow
- Generative model
- DTW
- agnoster폰트
- GAN
- 프라이탁 존버
- 캐나다 TDBAnk
- 캐나다 TD 예약
- 캐나다월세
- 딥러닝
- Normalizing flow
- GenerativeModel
- MachineLearning
- agnoster폰트깨짐
- 캐나다콘도렌트
- EATS
- pytorch
- 콘도렌트
- 프라이탁
- 캐나다 TD 한국인 직원 예약
- iterm2환경설정
- agnoster폰트꺠짐
- Docker
- 캐나다 TD 한국인 예약
Archives
- Today
- Total
목록딥러닝전처리 (1)
TechNOTE
Mel spectrogram 설명
음성 데이터를 raw data를 그대로 사용하면 파라미터가 너무 많아지기도 하고 데이터 용량이 너무 커지므로 보통 mel spectrogram을 많이 사용한다. 이게 뭔지 제대로 알아보도록 하자! 1. 음성파일 로드 sampling rate 24000 으로 구성된 wav 파일을 로드해 보면 다음과 같다. sampling rate가 24000이라는 말은 1초에 음성 신호를 24000번 sampling 했다는 뜻이다. 2.STFT(Short Time Fourier Transform) 이 데이터에, STFT(Short Time Fourier Transform)를 해 준다. STFT란 뭘까? 그 전에 푸리에변환이 뭔지부터 보자.. 푸리에 변환? (Fourier Transform) www.youtube.com/w..
음성
2020. 11. 20. 12:00