zoukankan      html  css  js  c++  java
  • Python 音频数据扩充的技巧

    经典的深度学习网络AlexNet使用数据扩充(Data Augmentation)的方式扩大数据集,取得较好的分类效果。在深度学习的图像领域中,通过平移、 翻转、加噪等方法进行数据扩充。但是,在音频(Audio)领域中,如何进行数据扩充呢?

    欢迎加入我的QQ群`923414804`与我一起学习,群里有我学习过程中整理的大量学习资料。加群即可免费获取

    Audio

    音频的数据扩充主要有以下四种方式:

    • 音频剪裁(Clip)
    • 音频旋转(Roll)
    • 音频调音(Tune)
    • 音频加噪(Noise)

    音频处理基于librosa音频库;矩阵操作基于scipy和numpy科学计算库。

    以下是Python的实现方式:

    音频剪裁

    import librosa
    from scipy.io import wavfile
    
    y, sr = librosa.load("../data/love_illusion.mp3")  # 读取音频
    print y.shape, sr
    wavfile.write("../data/love_illusion_20s.mp3", sr, y[20 * sr:40 * sr])  # 写入音频
    

    音频旋转

    import librosa
    import numpy as np
    from scipy.io import wavfile
    
    y, sr = librosa.load("../data/raw/love_illusion_20s.mp3")  # 读取音频
    y = np.roll(y, sr*10)
    print y.shape, sr
    wavfile.write("../data/raw/xxx_roll.mp3", sr, y)  # 写入音频
    

    音频调音

    import cv2
    import librosa
    from scipy.io import wavfile
    
    y, sr = librosa.load("../data/raw/love_illusion_20s.mp3")  # 读取音频
    ly = len(y)
    y_tune = cv2.resize(y, (1, int(len(y) * 1.2))).squeeze()
    lc = len(y_tune) - ly
    y_tune = y_tune[int(lc / 2):int(lc / 2) + ly]
    print y.shape, sr
    wavfile.write("../data/raw/xxx_tune.mp3", sr, y)  # 写入音频
    

    音频加噪,注意:在添加随机噪声时,保留0值,否则刺耳难忍!

    import librosa
    from scipy.io import wavfile
    import numpy as np
    
    y, sr = librosa.load("../data/raw/love_illusion_20s.mp3")  # 读取音频
    wn = np.random.randn(len(y))
    y = np.where(y != 0.0, y + 0.02 * wn, 0.0)  # 噪声不要添加到0上!
    print y.shape, sr
    wavfile.write("../data/raw/love_illusion_20s_w.mp3", sr, y)  # 写入音频
    

    OK, that's all! Enjoy it!

  • 相关阅读:
    微信小程序-上传多张图片加进度条(支持预览、删除)
    php中120个内置函数
    angular6 NgModule中定义模块module
    Aliasing input/output properties
    angular6 Can't bind to 'zzst' since it isn't a known property of
    [转]DOM 中 Property 和 Attribute 的区别
    Angular6
    [转]VirtualBox 修改UUID实现虚拟硬盘复制
    pthread_create如何传递两个参数以上的参数
    linux 线程操作问题undefined reference to 'pthread_create'的解决办法(cmake)
  • 原文地址:https://www.cnblogs.com/paisenpython/p/10297673.html
Copyright © 2011-2022 走看看