zoukankan      html  css  js  c++  java
  • 毕业设计记录——3.4

      今天实现了通过nodejs自动保存主讲人的视频生成webm文件,同时生成一个ogg音频文件。webm针对之后的视频回放,ogg针对语音转文字生成会议纪要。

    关于语音转文字,阿里、腾讯的api好像都是收费的,打算使用百度正在测试的音频文件转写api,目前正在申请测试资格。

      问题:1.视频回放想做成所有主讲人视频的集合,但是目前只能生成单个视频文件,而且这还是需要主持人来控制,点击开始会议则开始录制,结束会议则保存成一个文件。

         2.音频倒是可以生成多个音频文件再转文字,如何对应某个主讲人。

         3.目前测试资格还未申请下来,大概看了下api,好像只能识别["mp3", "wav", "pcm"]这三种,还需要调用ffmpeg把ogg转成成wav。

         4.百度语音识别是在python上跑的,这样的话,系统集成为一个比较麻烦。会议管理流程是用spring boot写的,视频用的nodejs,就无法部署到我那廉价阿里云服务器。

  • 相关阅读:
    2012年春晚剧本
    研究机器人
    85.圆角边框的两大要素 Walker
    81.边框设置 Walker
    76.背景固定 Walker
    84.边框方向 Walker
    86.圆角边框设置 Walker
    82.边框宽度和边框颜色 Walker
    88.轮廓和样式重置 Walker
    77.背景简写 Walker
  • 原文地址:https://www.cnblogs.com/ssyh/p/12416564.html
Copyright © 2011-2022 走看看