zoukankan      html  css  js  c++  java
  • 转:催熟智能音箱,争夺一个人工智能之梦

    原文:http://36kr.com/p/5079975.html

    深圳的硬件方案商吴桥今年很“牛气”:接到的合作电话络绎不绝,他拒绝掉的人也数不胜数。

    感谢智能音箱。吴桥估摸说,自己平均每个月会接到20至30家公司的电话,来自互联网公司或硬件厂商,想跟他在智能音箱设计方案上合作。但他任总经理的海克莱特,在芯片方案商扎堆的深圳属于中等规模,同一时期内能承接的订单在3至4家左右。这意味着绝大多数打电话过来的人,会失望而归。

    仅在深圳市南山区方圆一公里的范围内,就聚集了上百家智能音箱方案商,他们从供应链内的各类公司拿到语音模组、芯片,然后迅速拼出一个解决方案。喜马拉雅FM硬件事业部总经理李海波对36氪说,自己迄今已经在市面上看到上百个新生的智能音箱品牌。

    从小米、京东这样有硬件生产销售优势的公司,到科大讯飞这样的算法技术公司,到联想、海尔这样的传统硬件制造商、传统音箱厂商……几乎行业内稍有名气者都在做智能音箱。据36氪所知,接下来两个月,包括出门问问、猎豹在内的几家公司都会发布智能音箱新品。

    BAT也都在行动。几天前,阿里巴巴宣布将与喜马拉雅FM合作开发智能音箱。腾讯也在推进智能音箱项目。百度起步最早,做了开放平台,试图把和小鱼在家合作推出的视频通话机器人推举成标杆性产品。

    一切始于亚马逊Echo音箱两年前在美国的走热。2014年底,亚马逊发布的这款产品,第一代Echo的设计很简单,主要是个音乐播放器。亚马逊之后又往Echo上叠加了叫Uber、订购Pizza、查询天气甚至银行账户等功能,把它拓展成智能家居的控制枢纽。

    此后,这成了所有硅谷巨头都在争抢的焦点。上个月,微软、Google先后在开发者大会放出新款智能音箱。同月,亚马逊又推出了带屏幕的“变种音箱”Echo show。到了上周,苹果也出场了,在WWDC大会上发布了音箱Homepod——中国公司们当然也不甘错失风口。

    焦燥感正笼罩着这个行业。两家传统大硬件公司今年1月意识到智能音箱是个风口,三四个月后就召开了盛大的发布会,推出了产品。然而一名从业者告诉36氪,发布会上演示的仅仅是个手板,尚不能发声,“目的就是先立一个产品在那,代表自己也做了。但硬件是有自己的逻辑的,从手板到DV板再到最终成品的打磨,通常至少需要八九个月。”

    原本,由于PC销量下滑,吴桥原本做平板方案商的同行们生意惨淡,有些公司为了拿订单,不惜先为客户垫付几百万。吴桥眼看着很多同行撑不下去了。但感谢智能音箱,深圳硬件产业的幸存者今年纷纷转到了这个新风口上,现在的吴桥们,又成了被“求着”的人。至少,吴桥觉得,可以赚一笔快钱。

    但深圳南山做出来的大部分Demo,是销往海外的。在中国国内,智能音箱这个产品有些尴尬:至今,在中国也没有诞生出一个类似亚马逊“Echo”的爆款。

    目前,中国销量最大的智能音箱,是京东和科大讯飞的合资公司灵隆科技所做的“叮咚音箱”。官方对外宣布的销量是累计100万台,据此计算,是Echo的1/10。这个规模差强人意——因为音箱不能只是音箱,它“必须”是个入口,这一切才有意义。

    所以,催熟出一个爆款,成了所有人的目标。

     摸索、摇摆、起步

    魏强和七八个同事,俯身围着Echo站成了一个圈,挨个喊关键词试图唤醒它。然而多数时候Echo无动于衷,除了简单的新闻、天气预报和Amazon会员能试听的几首歌,搭载在音箱上的海外服务几乎全都无法启用。

    那是2014年年底,魏强还在京东智能产品中心当总监。

    当年11月上市的第一代Echo,已经通过朋友代购或淘宝等渠道,悄然流入中国互联网公司的产品部门。

    Echo最早展示了智能音箱的可能性:不仅是智能家居,也是购物和服务的中枢。这让京东感到兴奋。

    两三年前,无论是小米为首的手机厂商、海尔这样的家电公司,还是京东这样的渠道,都在言必称智能家居、智能硬件。就像当时所有试图成为中心入口的公司一样,京东曾做过一个“京东微联”app,来操控各种硬件。但用户并不活跃。

    “比如你要开灯,直接按下开关就行;但如果通过App控制,你首先要掏出手机,打开APP,再按下开关。”新办法反而比老办法麻烦得多。魏强反思,直到智能音箱这种更自然的交互形态出现,入口这事才算看到眉目了。

    很快,把亚马逊做为自己参照系的京东,年底就与科大讯飞开始合作,到了2015年正式注册了合资公司灵隆科技,京东占股45%,科大讯飞占股55%。这是中国探索智能音箱最早的公司之一。魏强后来担任了这家公司的CEO。

    同年8月,第一款叮咚正式发售,售价798元。三块功能拼起了它最初的形态:基本的音乐播放器、能简单聊天的助手,以及用语音操控京东微联中400款家居的能力。相当于给京东微联加了张嘴和喇叭。

    刘强东对这个项目非常重视。首发时京东商城拨给魏强一个月的3C类战略单品首页位置,还有各种免费资源、秒杀、优惠券。

    同样在Echo出现那年,创业公司Rokid,也决定做款入口性质的智能语音机器人。创始人Misa之前是阿里巴巴M工作室领头人,负责深度学习、视觉和自然语言处理研发。现在,36氪跟智能音箱从业者打交道时发现,大家一般都会拿先行者Rokid的产品作为研究样板。

    Rokid设计第一代产品时,希望吸引到虽然小众但是高端的用户,力求突出“黑科技”的感觉:实现语音、视觉多种交互模式,同时希望能有类似视频通话、给小孩子看绘本故事等功能。

    最终,去年初代产品ALIEN面市时,带有麦克风音箱、投影仪和来自苹果供应商的面板。尽管已经按成本定价,但售价依然高达5280元。

    更重要的是,这家公司发现,周全的交互设计,或许反而限制了用户对语音的使用率。

    亚马逊Echo最初曾经因为只支持语音交互,饱受诟病。比如,当你想用智能音箱订外卖,通过阅读屏幕文字选定菜品或许只需要花费你几十秒,要等语音把餐厅的整张菜单报完,却需要几分钟。

    但事后反观,恰恰因为Echo的这种设计,“迫使”用户大量使用语音来操作音箱,一来为亚马逊积累了大量交互数据,二来也让用户形成使用语音的习惯。

    从如今国内的产品来看,用户使用语音的习惯堪忧。“目前(语音交互)也只有电视上能看到明确的消费场景,每天有固定量级的用户通过语音搜电影,进行消费。而且每年的量级达到千万,远超过音箱。”一位行业内人士对36氪说,目前电视端语音的使用比例在20%。

    每天,魏强都要看叮咚音箱的活跃度。因为足够活跃才能吸收更多数据,提升语音识别的精准度。而准确率和用户体验,才是让一个全新品类成为爆款的基础。他告诉36氪,目前叮咚语音交互的日活为25%,周活40%,月活70%。

    一个共识是,Echo的兴起,其实跟大家最开始对echo的低预期有关。亚马逊最初并没有大推Echo,所以早期用户对Echo的语音识别准确率,以及有用程度期待不高,加上价钱也不贵,结果用了后反而有惊喜,口碑很好。而且,实际上新鲜感过后,把echo扔在一旁的用户也大有人在。

    一名业内人士对36氪说,几个月前自己在一场展会上看了一百多款智能音箱,其中语音识别准确度最高的,十句里也只能听懂三四句指令,更不乏全部辨识失败的产品。

    一家内容提供商对36氪说,即使是语音识别准确率最好的叮咚音箱,目前点播准确率也只有40-50%。

    “高频功能不好用,低频功能不咋用,”上述人士觉得这是现国内智能音箱产品的关键问题:厂商们虽然都在急迫地接入各种内容,却没把音箱内容的体验做好。“比如你要点首歌听,还要在音箱选二级目录,下面再选虾米音乐还是咕咪,再选歌。非常麻烦。”

    迄今为止,Echo的销量已经过千万量级。但它的成功,在中国复制起来却挺困难。

    “美国人觉得听音乐是生活中的必需品。”喜马拉雅的李海波评价。第一代Echo上市后,首先圈占的就是传统音箱四分之一的市场。让它的销量继续攀升的,是更多诸如听歌、阅读Kindle电子书等内容和服务的接入。苹果Homepod发布时,强调的也是自己的音乐播放能力,只是提了一下能用siri。

    小米作为“战略新品”的音箱,主打的就是自己的音乐、音频内容有多么丰富,并没有强调“智能”。“没有内容的电视只是一块显示屏,没有内容的音箱只是扬声器。”小米对36氪评价说。即便如此,相对于美国,中国人对音箱的使用需求天然不足。

    在中国,魏强听到过来自京东采销同事的质疑:“他们觉得一款音箱要卖几百万是不可能的。”

    出门问问的李志飞觉得,现在整个中国的智能音像市场一年能有100万台的出货量,就挺不错了。今年八九月份,出门问问也即将推出一款智能音箱,他认为对于一家硬件商,如果第一年能卖出10万台,就算成功。

    就在上个月,亚马逊新发布的Echo Show,改变了此前的音箱形态,带有一块内置触摸屏。这意味着更全面和完整的交互方式,但更关键的是Echo选择在用户适应了语音交互后,再做这道“加法”的时机。

    而且,亚马逊在过去一年已经逐步将 Echo 背后的语音助手 Alexa 做成了一个开放生态,截至去年下半年,Echo整合的第三方服务已经达到950项。

    叮咚音箱已经出了6个系列产品。其中一款的主打功能是儿童陪伴。小孩可以跟音箱提要求,给自己读本故事书,或者跟机器人学英语。这反而是能被用得比较频繁的功能和场景。

    小鱼在家和百度,在合作开发针对儿童教育场景的音箱。更多小巧便携的音箱,也出现在今年的新品市场上。喜马拉雅即将在下周召开一个发布会,据称,口号是“想听啥都有”,应该是要推出一款音箱,主打的几个场景,一个是陪伴小孩,一个是陪伴老人,“给来段沙家浜”。

    吴桥在深圳观察到,很多客户们已经开始在细分场景上添加功能。“有的开始带屏幕、有待放客厅、有的专门为浴室设计,包括房厨房的也有。”

    积极的信号是,魏强观察到,智能音箱的销量正以每年超过100%的速度增长,远高于他预估的50%。

    赶在苹果Homepod发布的同一周,Rokid发布了自己的第二代产品PEBBLE。相对于初代,拿掉了屏幕和前投影,体积接近先前的二分之一。售价1399元,也有别于初代的高端定价档位。过一阵,这家公司会再发布第三款音箱产品。“快速迭代,就是为了对今年的市场竞争环境提前做些准备。”Rokid感受到了行业竞争的紧迫感。

    升级之战:成为intel或者苹果?

    相比此前的“入口之争”,如果说智能音箱这波浪潮有什么变化,那就是做出一个产品的门槛明显变高了:从AI语音算法技术、到硬件方案、到内容公司、销售渠道,少了哪个环节,都无法形成完整的体验。

    这意味着,行业里需要强有力的整合者。

    整合内容,是第一道门槛。

    一位方案商对36氪透露,通常咕咪、虾米这类音频内容商会设置一道合作标准:销量10万台;入门费通常40-50万,最低也得30多万;每一台音箱还需要单独交费;如果超过内容商限定的播放次数,厂商也要再补钱。

    强势角色之一,是AI技术平台。“变成了智能音箱,背后有算法、有内容、有生态,我们就会开始比传统音箱占优势了。”出门问问李志飞说。

    正因如此,吴桥对36氪说,“这不是小的方案商或硬件公司能整合的,现在都是由BAT、讯飞这类平台型公司来谈的了。”

    上百家无处获取内容和服务的智能音箱,足以让一批有整合能力的平台赚上一笔。科大讯飞目前的商业策略,是将自己的算法技术、语音模块、合作方案商的设计Demo、后端内容提供商这整条链路,打通做成一个完成的产品,卖给需要的公司。

    就像套麦当劳快餐,小公司趋之若鹜。

    不过,技术供应商虽然能赚上一笔,也有自己的尴尬。“在硬件方案后面的生态场景、用户体验都还不是很成形的情况下,一个品牌厂商什么都不管,在深圳找一个供应商,把平台的系统放在里面就卖了,是做不好的。”李志飞说。

    也有些从业者对36氪表示,科大讯飞虽然牌子硬,但要获取它的一整套方案,需要付出不小金额的代价。这又让一批愿意免费开放的平台,获得了生存余地,甚至是先机。

    百度这样的大公司,又进一步拨快了竞争的计时器。

    李彦宏在去年9月的一次会议上宣布,百度对开发者和企业开放“百度大脑开放平台”和“百度深度学习平台”。简单来说,百度会输出语音能力、图像能力、自然语言处理能力和用户画像方面的技术和开发工具。更关键的是它采取的模式——免费。

    “一旦to B市场上出现一家巨头免费,其他人就没得玩了。”36氪采访的多位创业者,很快意识到这点。对于没有挂靠上任何平台的小公司,这个讯号尤其危险。

    更重要的是,免费平台之争会让这场战争加速。就像滚雪球,用户规模越大的平台,获取数据的速度会越来越快。相应的,经由不同数据量级训练的语音品质,音箱语音识别准确率的差距,也会迅速拉大。

    一些此前单纯向企业出售算法生存的小公司,已经被迫尝试自己做面向消费者的硬件产品。然而,这些公司接下来还得面对供应链、销售渠道、内容整合的问题。

    “很多公司都在跟风音箱,有算法就想自己出硬件产品,从麦克风阵列、处理芯片、降噪算法、声学结构到内容和服务整合全部自己做。结果他们找的方案商就从各处拿语音模块、芯片,只能拼凑出一个粗糙的产品。”一名业内人士说。

    更长远来看,就像硅谷一样,这个市场巨头会更有胜算。

    BAT这三家生态巨头中,百度的高层频繁出席每一次小鱼在家的发布会,力求把它推成行业标杆,携“百度大脑”的平台能力占据行业制高点。

    阿里和腾讯,沉淀了中国最大量级的用户数据,自身生态已经占据了互联网服务和内容行业的顶端。只欠一款音箱,把一切串联起来。

    京东攥着与大量品牌商的合作关系,京东微联已经整合了1000个SKU。魏强的设想是,以后所有通过叮咚音箱接入智能家居场景的设备,都统一用京东的账号,最终可以通过电商或其他路径在京东生态变现。

    小米的生态链上已经有一连串的高销量产品,它自己的网站和小米之家销售渠道都颇通畅。小米对36氪称,已经推出了人工智能开放平台“水滴计划”。

    不过一个平台要立足,需要前端连接上大量爆款产品,而不是一堆僵尸硬件。Amazon后来能够驾驭一个智能音箱入口平台,也是因为自己先做出了Echo这个爆款。所以BAT都在以自营或合作的方式,制造音箱。

    一名业内人士判断,两年内,如今上百家从业者会被洗牌至两位数,包括少数几家有强大生态的平台,和能实力作出爆款产品的硬件公司。

    今年叮咚音箱的首要任务就是“上量”。

    京东商城目前是国内智能硬件品类最大的线上销售渠道之一。618大促期间,京东电商给了叮咚音箱一系列最好的位置,打出大幅价格促销。“现在他们见到我们都头疼,一去就是要资源的。”

    本月的上海CES Asia上,灵隆发布了一款仅售399元的小巧音箱叮咚TOP,这款产品的玄机在于,将其连接到家中已有的传统音箱,就可以把后者直接变成智能音箱。这就跟不用换电视、直接买个电视盒子一个策略。

    这些都像是Echo趟过的路。此前的几代Echo,亚马逊不断做促销,价格从不到180美金,下探到50美金,甚至产品有的不到39美金。对于美国用户,尝试成本很低。“吃顿饭的成本就能买一台echo尝鲜,门槛很低。”徐超说。

    好在,现在的成本已经大幅降低。两年前调试一套方案至少需要半年时间,如今已经缩减至两个月。芯片成本也降低至十年前的五分之一。为智能化多掏20块钱的“体验”成本,已经进入用户可接受的区间内。

    Echo还开发出买硬件送软件的销售策略,将硬件销售与亚马逊会员绑定,购买一台设备可以送付费音乐。

    根据公开资料,在去年2016年底11月和12月的美国年底促销季中,Echo的销量占到全年的45%。这意味着性价比和促销策略,在Echo销量的增长中起了不小作用。当然,亚马逊通过智能音箱的盈利之路很清晰:Echo可以促进销售。

    至少目前,智能音箱在中国的需求还没那么强烈,使用习惯尚待培育。在看上去很美好的商业蓝图实现之前,每家公司都在牟足力气催熟音箱,从看起来尚可,到在消费者中真正引爆之间,还有一段不短的路。

  • 相关阅读:
    POJ 3261 Milk Patterns (求可重叠的k次最长重复子串)
    UVaLive 5031 Graph and Queries (Treap)
    Uva 11996 Jewel Magic (Splay)
    HYSBZ
    POJ 3580 SuperMemo (Splay 区间更新、翻转、循环右移,插入,删除,查询)
    HDU 1890 Robotic Sort (Splay 区间翻转)
    【转】ACM中java的使用
    HDU 4267 A Simple Problem with Integers (树状数组)
    POJ 1195 Mobile phones (二维树状数组)
    HDU 4417 Super Mario (树状数组/线段树)
  • 原文地址:https://www.cnblogs.com/talkaudiodev/p/7041527.html
Copyright © 2011-2022 走看看