zoukankan      html  css  js  c++  java
  • 《星际迷航》语音翻译器成真

    【为什么重要】

    能够即时翻译口语的软件,使不同语言之间的交流大大简便。

    对于学习新语言来讲,这可能就是下一个重大创新。微软的研究人员已经成功演示了能够几乎立即将英文口语翻译成中文口语的软件,同时还能保持说话者独有的声音顿挫。这可能使交流的效率更高,更加个人化。

    10月25日,微软公司首席研发官里克•拉希德(Rick Rashid)在中国天津首次演示了这款软件。拉希德对现场的观看者说:“我在说英语,你们将听到用我自己的声音说出的汉语。”该系统识别出说话者说出的单词,将文本迅速转换成为通顺的中文句子,然后将其交给经训练能够复制说话者声音的语音同步软件。

     
    这段演示视频被现场观众录了下来,一直在中国的社交网站上广为传播。11月8日,拉希德在一篇包含视频的博客文章中,发布了一段在讲英语的观众中的演示视频。
     
    微软在今年早些时候曾演示了能够将同步语音进行修改,使其与某个人的声音相匹配的技术,但这一系统只能说出人工合成的文本。该软件需要大约一小时的训练,才能对人声进行同步,其原理是对旧的文本-语音转换模型进行调节,让它能够发出像说话者一样的某些声音。
     
    AT&T曾经展示过一个英语和西班牙语的在线翻译系统,谷歌也因建立自己的实验性在线翻译系统而著名。然而,这些公司开发出的原型都不能将同步语音和说话人的声音相匹配。
     
    微软的这一系统是该公司最新的语音识别技术的展示,该技术是采用脑细胞的网络运行原理的学习软件的基础上开发的。在一篇关于该技术演示的博客文章中,拉希德表示,这一技术的采用,可能诞生未来几十年内在识别精度上最重大的一次飞跃。他写道:“现在的错误率是七八个词错一个,而不是四五个词错一个。”
     
    微软不是唯一一家通过研究神经式网络来开发语音识别系统的公司。谷歌最近也开始在其语音识别应用程序和服务中使用自己的基于神经式网络的技术(见《谷歌的虚拟脑技术》一文)。谷歌的工程师表示,使用这一方法能够使错误率降低20%-25%。
     
    拉希德通过电子邮件对《麻省理工科技创业》表示,他和北京的微软亚洲研究院的研究人员尚未使用该系统与公司之外的任何人进行过对话,但公开演示已经激起了很多人的浓厚兴趣。
     
    他说:“我看到了人们对于这项技术所开辟的未来产生的激动、惊奇和乐观。”
     
    拉希德表示,该系统还远远不完美,但他也提到,用它足以实现本不可能实现的交流。微软和谷歌研究基于神经式网络的方法的工程师们,对于从该技术中挖掘出更多力量表示乐观,因为该技术还在开发过程中。
     
     “我们还不知道这一技术能达到的精度极限,它太新了。随着我们用数据对系统进行‘训练’,它似乎会变得越来越出色。”
  • 相关阅读:
    Go排序
    golang 二维切片
    leetcode 406. 根据身高重建队列
    golang实现二叉搜索树
    Golang之实现(链表)
    docker把web jar包制作成镜像
    Failed to start Docker Application Container
    前端 velocity(.vm)模板里写ajax出现解析异常
    idea常用快捷键
    ArrayList、Vector、LinkedList(jdk8)
  • 原文地址:https://www.cnblogs.com/jessonlv/p/4388046.html
Copyright © 2011-2022 走看看