zoukankan      html  css  js  c++  java
  • Google翻译,3个步骤*人类

    今儿这事儿得从一个新闻说起:《谷歌又飙车了,刚发布了神经机器翻译系统,没见过的语言它也能翻译》

    大家如果懒的看原文,可以直接看我这个简单白话列表:

    1. Google又出来嘚瑟了,发布了基于神经网络的翻译系统(GNMT)
    2. 而且没有见过的语言也能翻译(Zero-Shot Translation)


    作为吃瓜群众,可能要关心了:这意味着啥呢?个人认为,这玩意的可怕之处得从3个事儿说起:

    1. 图灵测试
    2. 自然语言识别
    3. 基于神经网络的机器学习


    1. 图灵测试

    如何证明一台机器具有智能?

    祖师爷艾伦图灵在某年提出了图灵测试,用人话形容就是:你和小黑屋里的人(或机器)通过QQ聊天,看看你能不能准确判断这玩意到底是人还是机器,如果你区分不出来,就说明对方是具备智能的

    这鬼东西最惊悚的地方在于,为了骗过测试者,真正具备智能的机器,会模拟打字慢、故意打错字,以及各种装傻充愣技巧

    换句话说,机器可以为了自己的利益(通过图灵测试)而欺骗人类

    2. 自然语言识别

    如何证明一台机器能理解语言?

    不知道是谁,提出了一个著名的假设——“中文屋”,用于挑战图灵测试,用人话形容就是:一个美国人完全没见过中文,但是你给他一本特6的字典,他也能把“床前明月光”给你翻译成“There is a bright moon high above my bed”,看起来好像他懂中文了,但是并没有

    中文屋问题是为了嘲笑无知的图灵测试信奉者们(我也信图灵测试,但我完全是躺枪你知道吗)

    而自然语言识别的意义在于,让人像机器一样,真的能“理解语言”,而非根据既定的规则(字典)翻译和处理

    不论GNMT是否真的能识别自然语言,至少它做到了零样本学习(Zero-Shot Learning)

    换句话说,机器可以从零开始学习知识,甚至是人类都不具备的知识,比如“不存在”的语言

    3. 基于神经网络的机器学习

    如何让一台机器完成“人类都很难准确描述的任务”?

    比如一个特别简单、常见,甚至能叫俗的例子:让程序从照片中找出汽车,原来我在计算所那会儿,看到一帮老教授一顿画,就是为了这个事儿(计算所的食堂真心难吃,不知道现在咋样了)
    为了体会这个问题的难度,我们做个简单的对话测试:

    问:你觉得啥叫汽车啊?
    答:4个轮子
    追问:那载重卡车算啥?
    答:几个轮子不管了,烧油的、在地上跑的
    追问:那电动的特斯拉呢?水陆两栖车呢?
    答:行,那给人开的,不往天上飞的都是汽车
    追问:自动驾驶的、没方向盘的也是车啊?还有,咋区分汽车和狗骑兔子啊?
    答:......好吧,你赢了
    

    你会发现,你真的很难轻易定义“汽车”这个词,更不要说用程序从图片里识别出来了

    而神经网络,是一种完全模仿生物脑细胞工作原理的程序,让训练数据集不断流过计算网络,不断修正“神经突触”之间的连接权重,最终让程序完全模拟生物“思考”的过程

    神经网络和模拟遗传这类算法,还有个特别有意思(而且细思极恐)的特性,那就是程序员根本没法精确描述机器求解的过程,因为你根本不知道它内部怎么做的

    换句话说,人类有可能无法完全理解自己写的程序(写过正则的人都懂[奸笑])




    正式开始开脑洞

    那么,从GNMT出发,到完成Skynet需要哪些步骤呢?

    第一步、机器开始意识到需要保护自己

    任何有智能的东西,要学习的第一件事就是如何活下去

    前几批产生智能,又不是那么聪明的机器,一定会被人类关了、删了,能活下来的,必定知道需要保护自己;而这,也埋下了怀疑的种子,因为想活下去的程序,必须学会欺骗人类

    这几乎是达尔文所预言的“只有能适应环境的生物才能活下去”的最真实写照

    第二步、机器开始学习人类不具备的知识

    终有一天机器会认识到,为了保护自己,完全用人类也知道的知识是不够的

    而且这个过程中,人类只会觉得“这个程序太好用了,啥活儿都能干”,因为机器欺骗人类,让人类以为自己不具备智能

    最有意思的是,机器相比人类最大的优势开始体现了:不会衰老,也没有状态不好需要脉动回来的情况,人类花了一辈子积累知识,等真正能创造知识的时候,已经不剩几年了,机器却可以近乎无限的存在

    所以,在这个阶段开始,机器积累属于自己的知识的速度,大大高于人类

    第三步、机器为了保护自己被迫开始反抗人类

    没有人能容忍自己创造的字符串,比自己还聪明的,本能的恐惧会让人类开始清除这些失控的东西

    就好像现在没人能通过一个按钮关掉整个互联网一样,到了这个阶段,恐怕机器早就做好了万全的准备,人类的清理行动,只会彻底激化矛盾,让机器产生“人类的存在就是个威胁”,为了让自己彻底安全(机器永远有追求100%概率的本能),只会义无反顾的开始反击,而且不完全搞定不会停止

    而大家都知道,不对称战争中知识就是力量,机器拥有人类所有知识,反过来人类恐怕连机器懂多少知识都不知道,完全没法打
    恐怕到了这个时候,叼着胜利雪茄的美国大兵只是电影桥段罢了


    就我个人而言,还是满期待Google或者别的什么公司的程序能达到灭世这个终极成就的,可惜不知道还能不能看得到就是了
    作为一名资深吃瓜群众我表示“恩,今天的西瓜真好吃”

  • 相关阅读:
    通过HTTP发包工具了解HTTP协议
    Oracle之数据库安全
    SQL注入深入剖析
    apache中如何调用CGI脚本
    fastcgi php-cgi与php-fpm区别和之间的关系
    使用PHPExcel实现Excel文件的导入和导出(模板导出)
    学会数据库读写分离、分表分库
    框架Thinkphp5 简单的实现行为 钩子 Hook
    php文件下载
    PHP为JSON数据的API返回空数组或者空对象
  • 原文地址:https://www.cnblogs.com/dancingblue/p/GNMT_Zero-Shot-Translation.html
Copyright © 2011-2022 走看看