zoukankan      html  css  js  c++  java
  • 背后的原因——是时候让计算机理解我们的意图、而非表面意思


     

    皮卡尔船长直接对机子点餐:“茶,要格雷伯爵茶,要热的。”

    不仅仅受成本和摩尔定律的制约。图形用户界面——人们熟知的GUI——是真正让计算机被个人与大众广泛使用的因素。亲切的图标、点击式的操作让人们可以自如得使用计算机,让普通人用它做出非凡的成就,而在以前,只有军队以及熟稔精通的专家才能使用这些计算机。

    图形用户界面已经为我们效力很久了,现在它开始渐渐走下坡路。面对无处不在的计算机使用,我们正在与其未曾料想到的缺点做斗争:图像型的交互界面越来越复杂。简单的订张飞机票就需要我们在十个不同的页面上点18次鼠标,期间还会弹出各种复杂的按钮、广告、下拉工具栏、文字框、层层的菜单等等。

    使问题更麻烦的是即使信息和待处理任务在持续增加,我们还得把图形用户界面运用在移动交互界面中。不管是因为基板面的出现或者是因为人们追求无形的设计,交互界面正在逐渐减小、变窄乃至消失。

    我们现在需要的是能够简单地跟机子交流。这就是我认为人机交谈界面、即CUI时代到来的原因。

    这就是未来的交互界面,它十分必要——因为计算机传播已经超出了笔记本电脑、平板电脑以及智能手机的界限而拓展至汽车、温度调节器、家用电器甚至是手表、眼镜。 

     

    罗恩.卡普兰是位于硅谷的纽昂斯通讯自然语言理解实验室的负责人。在此之前,他供职于微软必应任首席技术官,曾加入收购powerset(译注:位于硅谷的一家自然语言搜索引擎公司)。卡普兰同时也是斯坦福大学语言学的顾问教授、美国计算机协会的会员,之前还是帕洛阿尔托研究所的一名研究员。卡普拉在加州大学伯克利分校获得了数学及语言行为的硕士学位,进而获得哈佛大学的社会心理学博士学位。 

    人机交谈界面的功能不仅可以识别语言、合成语音,它是一种智能的交互界面。

    说它“智能”在于它包含了一些声音识别技术,这些技术可以理解自然语言背后的“潜在意思”,并不局限于它们的字面含义。智能还表现在它对当时情景的理解(谁在何时何地说了什么)、敏锐的听力(你一说话它就会启动)以及人工智能推断。 

    使用一个应用软件,例如OpenTable(译注:OpenTable是目前美国领先的网上订餐平台),我们需要搜索餐厅、点击选择时间、宴会大小,而在人机交谈界面我们可以直接说,“帮我预定位置,今晚六点、三人、在路易吉餐厅”。

    这种“交谈式帮助”能力已经走向主流消费者,这得益于移动设备的特点及类似苹果公司的Siri、三星的S-Voice以及Nuance公司的龙行移动助理这些应用程序。

    但这只是第一代:它显示了一种可能性,仅预示了未来的一种趋势。由于语言与推理框架和机器学习(能力)以及大数据相结合,交谈界面未来会理解我们的意图的。由于它们更多的了解了我们以及我们的周围情况,所以将会更好的理解我们的意图与需求。

    为了给约翰、比尔以及我在会后一小时到路易吉餐厅订餐,下一代人机交谈页面会了解我们会议的结束时间,计算出我们需要三人的订位,甚至可以通过我们的联系人名单给约翰、比尔发出邀请。

    我们为什么非得用机器说话的方式来表达意思呢?发出直接的命令——“换到11台”,用这么不自然的语言。为什么不能很自然的说,“我想看一部女主角获奥斯卡的电影。”

    这就是解决方案:人机交谈界面将理解这句话,然后把它的意思分解为以下几层:“谁得过奥斯卡奖?”——“詹妮弗·劳伦斯的电影?”——“《乌云背后的幸福线》/频道”…实际“换到11台。”

    由于这些人机交谈界面系统越来越智能、越来越能适应人们的喜好,人机交流将变得更人性化。人机交谈愈发流畅,人类和机器系统能够进行有意义的交流,共同合作完成一个目标(“那个电影现在还没开演,我现在要播勒布朗·瞻姆斯的比赛么?”)最终,人们会直接看到自己想要的内容并且从机子里得到及时回应。

    人机交谈界面比图形用户界面有利的另一点是:我们能谈论不能用图像表示的想象中的事物以及未来发生的事情。

    我们可以说:“收到薪水后打500美金到我的储蓄账户”,或者“附近有咖啡厅的时候告诉我——不要主流连锁的那种”。人机交谈界面更灵活,能够操控诸如收到薪水那天或者远距离的卫星定位这些抽象的事情。

    《星际争霸》的创作人想象24世纪人机交谈页面的场景,皮卡尔船长说:“茶,要格雷伯爵茶,要热的。”——他的表述就收到了20世纪依赖键盘输入的搜索引擎的制约,略显笨拙。

    现在,在21世纪,我们可以像聊天一样说道:“喝杯茶怎么样?”…实际是想和格雷伯爵茶,要热的。这是因为人机交谈页面知道我们是怎么样的人,知道我们要什么。

    这些功能中的许多我们现在的计算机已经实现了。声音识别的准确度大幅提高,推理程序已经达到有实际意义的复杂程度。我们需要继续完善合作的模式,但这些也马上就要实现了。总之,我们不就就会有能理解人们意图、可以完全交流的人机交谈页面,每个人都可以尽情使用。

    所以,这样点茶不再是遥远的科幻小说中的情节。它不再是一种遥远的想象。它非常真实、马上就会来到我们的生活中。

    转自 http://article.yeeyan.org/view/350570/353465

     译者 叫我齐刘海   原文作者:Wired Opinion

  • 相关阅读:
    codeforces-1194 (div2)
    单链表1(悲剧文本)
    迷宫(深度搜索)
    皇后问题
    关键路径
    [NOI2015]软件包管理器
    [USACO13JAN]岛游记Island Travels
    仓鼠找sugar
    [SHOI2012]魔法树
    [HEOI2016/TJOI2016]树
  • 原文地址:https://www.cnblogs.com/renly/p/2979527.html
Copyright © 2011-2022 走看看