zoukankan      html  css  js  c++  java
  • python录制系统声音

    转载:python开发的录音机(一)录制声卡播放的声音(内录)

    环境准备

    python

    • wave
    • pyaudio

    wave 可以通过pip直接install,在安装pyaudio时,通过正常的pip install 直接安装一直处于报错阶段,后来想到可以通过轮子直接安装。

    pypi提供的安装包中有对应的安装包,注意,不仅仅是python2python3的区别,python3的小版本也有点差别。可杯具的是,小主电脑里装的是python3.8,后来想到还有一个网站可以安装pythonlibs,找到对应的版本后,下载下来。直接在文件所在目录,或者在安装中指定文件目录中执行安装

    pip install /c/Users/root/Downloads/PyAudio-0.2.11-cp38-cp38-win_amd64.whl

    代码和运行

    def audio_record(out_file, rec_time):
        CHUNK = 1024
        FORMAT = pyaudio.paInt16  # 16bit编码格式
        CHANNELS = 1  # 单声道
        RATE = 16000  # 16000采样频率
        p = pyaudio.PyAudio()
        # 创建音频流
        dev_idx = findInternalRecordingDevice(p)
        stream = p.open(format=FORMAT,  # 音频流wav格式
                        channels=CHANNELS,  # 单声道
                        rate=RATE,  # 采样率16000
                        input=True,
                        input_device_index=dev_idx, # 指定内录设备的id,可以不写,使用win的默认录音设备
                        frames_per_buffer=CHUNK)
        print("Start Recording...")
        frames = []  # 录制的音频流
        # 录制音频数据
        for i in range(0, int(RATE / CHUNK * rec_time)): # 控制录音时间
            data = stream.read(CHUNK)
            frames.append(data)
        # 录制完成
        stream.stop_stream()
        stream.close()
        p.terminate()
        print("Recording Done...")
        # 保存音频文件
        wf = wave.open(out_file, 'wb')
        wf.setnchannels(CHANNELS)
        wf.setsampwidth(p.get_sample_size(FORMAT))
        wf.setframerate(RATE)
        wf.writeframes(b''.join(frames))
        wf.close()
    

    在使用默认录音设备时,发现是话筒录音,效果并不是太理想,所以就去查查能不能直接录系统的声音。

    def findInternalRecordingDevice(p):
        # 要找查的设备名称中的关键字
        target = '立体声混音'
        # 逐一查找声音设备
        for i in range(p.get_device_count()):
            devInfo = p.get_device_info_by_index(i)
            print(devInfo)
            if devInfo['name'].find(target) >= 0 and devInfo['hostApi'] == 0:
                # print('已找到内录设备,序号是 ',i)
                return i
        print('无法找到内录设备!')
        return -1
    

    可以使用p.get_device_info_by_index()去查看系统有关声音的设备,通过设置为立体声混音就可以录制系统声音。

    保存声音

    def save(fileName):
        # 创建pyAudio对象
        p = pyaudio.PyAudio()
        # 打开用于保存数据的文件
        wf = wave.open(fileName, 'wb')
        # 设置音频参数
        wf.setnchannels(CHANNELS)
        wf.setsampwidth(p.get_sample_size(FORMAT))
        wf.setframerate(RATE)
        # 写入数据
        wf.writeframes(b''.join(_frames))
        # 关闭文件
        wf.close()
        # 结束pyaudio
        p.terminate()
    

    保存声音是通过上述代码进行保存,此处的_frames是个list,是通过每录一个chunk(数据流块),就把这一块的数据添加进去

    然后只需要重新创建PyAudio对象,把这个list转为字节串保存到文件中就可以了

    问题

    上述一般可以录到系统声音,但在执行的时候发现,并不能。

    原因是:win的输入设备中没有配置立体声混音

    设置步骤:

    • 在win的声音调节出,右击打开声音设置
    • 找到管理声音设备
    • 在输入设备处启用立体声混音

    就此,就完成了录制系统声音的需求

    注意

    上述操作,可以外放,可以插入3.5mm耳机,但系统静音tpye-c耳机插入的时候不能录到声音

    完整代码

    import os
    import pyaudio
    import threading
    import wave
    import time
    from datetime import datetime
    
    # 需要系统打开立体声混音
    
    # 录音类
    class Recorder():
        def __init__(self, chunk=1024, channels=2, rate=44100):
            self.CHUNK = chunk
            self.FORMAT = pyaudio.paInt16
            self.CHANNELS = channels
            self.RATE = rate
            self._running = True
            self._frames = []
    
        # 获取内录设备序号,在windows操作系统上测试通过,hostAPI = 0 表明是MME设备
        def findInternalRecordingDevice(self, p):
            # 要找查的设备名称中的关键字
            target = '立体声混音'
            # 逐一查找声音设备
            for i in range(p.get_device_count()):
                devInfo = p.get_device_info_by_index(i)
                # print(devInfo)
                if devInfo['name'].find(target) >= 0 and devInfo['hostApi'] == 0:
                    # print('已找到内录设备,序号是 ',i)
                    return i
            print('无法找到内录设备!')
            return -1
    
        # 开始录音,开启一个新线程进行录音操作
        def start(self):
            threading._start_new_thread(self.__record, ())
    
        # 执行录音的线程函数
        def __record(self):
            self._running = True
            self._frames = []
    
            p = pyaudio.PyAudio()
            # 查找内录设备
            dev_idx = self.findInternalRecordingDevice(p)
            if dev_idx < 0:
                return
            # 在打开输入流时指定输入设备
            stream = p.open(input_device_index=dev_idx,
                            format=self.FORMAT,
                            channels=self.CHANNELS,
                            rate=self.RATE,
                            input=True,
                            frames_per_buffer=self.CHUNK)
            # 循环读取输入流
            while (self._running):
                data = stream.read(self.CHUNK)
                self._frames.append(data)
    
            # 停止读取输入流
            stream.stop_stream()
            # 关闭输入流
            stream.close()
            # 结束pyaudio
            p.terminate()
            return
    
        # 停止录音
        def stop(self):
            self._running = False
    
        # 保存到文件
        def save(self, fileName):
            # 创建pyAudio对象
            p = pyaudio.PyAudio()
            # 打开用于保存数据的文件
            wf = wave.open(fileName, 'wb')
            # 设置音频参数
            wf.setnchannels(self.CHANNELS)
            wf.setsampwidth(p.get_sample_size(self.FORMAT))
            wf.setframerate(self.RATE)
            # 写入数据
            wf.writeframes(b''.join(self._frames))
            # 关闭文件
            wf.close()
            # 结束pyaudio
            p.terminate()
    
    
    if __name__ == "__main__":
    
        # 检测当前目录下是否有record子目录
        if not os.path.exists('record'):
            os.makedirs('record')
    
        print("
    python 录音机 ....
    ")
        print("提示:按 r 键并回车 开始录音
    ")
    
        i = input('请输入操作码:')
        if i == 'r':
            rec = Recorder()
            begin = time.time()
    
            print("
    开始录音,按 s 键并回车 停止录音,自动保存到 record 子目录
    ")
            rec.start()
    
            running = True
            while running:
                i = input("请输入操作码:")
                if i == 's':
                    running = False
                    print("录音已停止")
                    rec.stop()
                    t = time.time() - begin
                    print('录音时间为%ds' % t)
                    # 以当前时间为关键字保存wav文件
                    rec.save("record/rec_" + datetime.now().strftime("%Y-%m-%d_%H-%M-%S") + ".wav")
    
    
  • 相关阅读:
    [原创]Linux下压力测试工具Webbench介绍
    [原创] 测试策略是什么?
    [原创]测试报告模板
    [原创]性能测试基础知识
    [原创]性能测试工具介绍
    [原创]LoadRunner性能测试过程
    [内部资料]LoadRunner培训初级教程
    [原创]什么是性能测试?
    [原创]软件测试CheckList文档
    开源博客秋色园QBlog多用户博客系统安装视频教程
  • 原文地址:https://www.cnblogs.com/ZSMblog/p/12376145.html
Copyright © 2011-2022 走看看