zoukankan      html  css  js  c++  java
  • AI 芯片,是金山还是泡沫?

    忽如一夜春风来,千树万树梨花开。随着 AI 产业的迅速发展,越来越多的企业都投身到了 AI 淘金这股浪潮中,而其中最为耀眼的便是 AI

     

    忽如一夜春风来,千树万树梨花开。随着 AI 产业的迅速发展,越来越多的企业都投身到了 AI 淘金这股浪潮中,而其中最为耀眼的便是 AI 芯片。

    aixinp.jpg

    2016 年 5 月,谷歌发布自主设计芯片 TPU(张量处理器),同年英特尔也发布 Nervana AI 处理器,去年,Deep Mind 投资的 Graphcore 公司也推出了 IPU 智能处理器;而就在国外企业纷纷研发 AI 芯片的同时,国内企业也同样没有闲着:在寒武纪推出神经网络处理器 NPU(今年其又被重命名为机器学习处理器 MLU)之际,深鉴科技则做了一款基于 FPGA 平台的 DPU(深度学习处理器),就连地平线也推出了嵌入式大脑处理器(BPU)……

    为什么会突然出现这么多 CPU、GPU 的兄弟?

    众所周知,目前业内最为人所知、应用范围最广的芯片是 CPU 和 GPU。

    其中,CPU 出现的历史最长,在电子设备中的作用也最为重要,但由于其仅用于串行计算,所以在需要海量计算的 AI 场景下,其数据处理能力已显然不够,而且雪上加霜的是,处理器的性能每 18 个月就能翻倍的摩尔定律也已几近失效,想要依靠摩尔定律提升 CPU 的性能已经不太现实。

    而就在此时,因为具有并行计算能力而拥有更强运算力的 GPU 开始被人们重视,并被广泛用于人工智能领域。从此,人工智能有了 GPU 在算力方面的支持,人工智能也迅速进入应用阶段。甚至有人表示, 没有 GPU,就没有这一波 AI 浪潮。

    而 GPU 领域的绝对霸主英伟达也因此扶摇直上,成为了当今人工智能领域最为成功的企业:2015 年,英伟达的市值是 100 亿美元,而目前其股价已暴涨至 1300 亿美元。

    然而,GPU 虽然帮助人工智能走过了蹒跚学步的初级阶段,但人工智能接下来的要走的路却不一定适合由 GPU 来走了。

    • 首先在云端,数据中心最大的成本支出一般都是电力成本,因此,能耗压力是迫使 GPU 让位的重要原因。比如,根据谷歌去年 4 月曝光的数据,当时,TPU 已经在谷歌数据中心内部使用大约两年,并依靠 TPU 打败了李世石。(根据谷歌的一份论文显示 TPU 平均比 Nvidia K80 GPU 或 Haswell CPU 快 15~30 倍,性能功耗比高出约 30~80 倍,不过英伟达对此反驳,认为谷歌是在拿 TPU 和旧的 GPU 进行比较,因此不客观。不过必须了解到的是,一般而言芯片功耗越高性能越强,因此,拿功耗高出很多的 GPU 与相对低功耗的 TPU 相比较,其实也不公平)。

    • 其次便是在终端,随着用户越来越关心个人隐私安全与时效性,此前以云端为基础的人工智能正逐渐部分或完全被终端智能所取代。而终端智能则要求芯片同时具备高性能与低功耗的特征。

    虽然 GPU 在处理很多人工智能问题时已经很高效了,而且 GPU 作为通用芯片可以适应各种不同的应用场景,但 GPU 在运行不同场景中的程序时,芯片的整体性能其实是很难完全发挥出来。其实也可以说,没有任何单一的 AI 系统能够在任何场景完美地工作。因此,AI 在不同场景中的应用,都需要针对场景的需求,在功耗、延迟、数据吞吐量、加速器方案的选择上做出调整和优化,使其能够完美运行适应特定应用场景的算法——于是,各种 CPU、GPU 的兄弟便诞生了。

    另外,地平线算法 VP 黄畅还表示即使是在同一细分应用场景下,只要深入行业,就会发现算法依然会有所不同。而这便意味着市场需要更多种类的 AI 芯片。

    总的来说,AI 芯片在此时出现是顺应时代发展趋势的。

    技术与落地,决定 AI 芯片生死的关键

    虽然目前市面上各种 X-PU 都因赶上了 AI 风口而欣喜不已,然而,今天拥挤在身边的是“兄弟”,在明天就可能是敌人了,想想 CPU、GPU 目前的寡头天下不就是活生生的例子吗?X-PU 们真都能笑到最后吗?这也是很多入局者都关心的一个问题。

    OnceAI 创始人张春亮坚信 AI 芯片行业不太可能出现一两家企业统治全部 AI 芯片的情况。“比如现在的通信市场,有追求高性能高速率的 5G 标准,但其也必然再来高功耗(的问题)。所以小数据量传输但低功耗的窄带需求量也越来越大。而且还有像 wifi、蓝牙、红外之类的不同场景间的传输协议。”张春亮在知乎上回应认为市场非常大,而且市场需求也不可能统一,因此,“AI 芯片以后很有可能深化出像 PIC/AVR 这样的低功耗低计算力的芯片,还有像 Intel/amd 这样的高计算能力高功耗的芯片,或者像 arm 适用于移动场景的芯片。”

    “AI 和任何一个新兴的技术都一样,引起市场广泛关注的时候都会有很多大佬以及创业公司进入到这个市场,然后开始做芯片。我其实觉得这是一件有趣的事情,因为只有这么多的公司从不同的角度去看待技术,去研发他们的技术,才能给市场带来真正的变革,然后才能把这些技术真正的落地。”英特尔新技术业务 Movidius 产品业务拓展负责人 Gordon 虽然很认可当前 AI 芯片的大量崛起,但这并不意味着现在所有但 AI 芯片企业都能活到最后,AI 芯片行业跟其他行业一样,也都将有一个优胜劣汰的过程:

    • 首先,做 AI 芯片的技术难度不小。“怎么把合理的架构和应用场景结合起来,把芯片的性能、功耗和使用场景结合起来,做出一个非常好的产品,这实际上对每个企业都是巨大的挑战。” 为了说明这一点,Gordon 还透露了一个他的经验:很多企业可能买了很多 IP,以为把它组在一起就能达到好的性能,但实际上这些产品并不一定能有市场。

    • 其次,也是最关键的,那就是市场化与产品落地。Gordon 就强调落地是一个“非常重要”的事情。Gordon 认为做芯片在技术上虽然有难度,但只要找到合适的人,其实也会有很多人都能做,但创业的本质并不是要做出一款技术上的好产品,而是要解决行业特定问题,从而赚钱养活自己。“而这里的问题就是你对产品的开发到底有多深的理解,一个是架构,一个是平衡,如何在性能、功耗、延迟等方面做好取舍,再一个就是对市场的理解,决定做那个行业等。”

    而该观点也得到了黄畅的认同,“只是做芯片是远远不够的,关键还是应用的落地,所以地平线是把算法和芯片结合在一起迭代优化,针对应用场景全程推动落地。”黄畅如此表示。

    给国内 AI 芯片创业公司的建议

    Gordon 表示,英特尔其实是众多 AI 芯片创业公司的巨大竞争对手,“我们虽然进来的晚,但我们在芯片领域有着多年的研究,慢只是慢在软件以及与场景的结合上。”Gordon 认为英特尔一个重要优势便是与行业有着非常紧密的结合,因此,Gordon 认为英特尔想要后来者居上其实也并非不可能。

    不过,面对巨头,中小 AI 芯片创业公司也并非没有成功的可能性。目前,市面上有一个观点就是像英特尔这样的大企业因为精力有限,无法覆盖所有的细分场景,因此,小企业便有了得以生存的夹缝。

    而该观点也得到了 Gordon 的证实:虽然英特尔非常看重垂直,但英特尔也会评估哪个垂直可能会先起来,或者有更大的市场,从而排优先级。“比如对某些行业,我们就必须要满足其需求,而对另一些行业,我们则只是尽量满足其需求,对第三种行业,那可能就是爱用不用了。”Gordon 认为对于像英特尔这么的大企业“必须学会取舍”。

    另外,Gordon 也为国内的 AI 芯片企业提了一些具体的建议:

    • 首先,要找对人,找对场景非常了解人,并可以跟产业结合,那就有机会成功。而如果只是纯做技术,不跟产业、应用结合,那就走不了多远。

    • 其次,选择行业是不要一窝蜂地盲干。“国内做 AI 的企业都集中在非常窄的几个领域,比如所有人都恨不得要去做安防的,但在海外,我们就看不见这种情况,海外企业会非常专注于自己擅长的行业,而这也是很容易做成绩的方法。”

    另外,ARM 的崛起也能给予大家一定的参考。

    ARM 公司 1978 年在英国成立,1985 年,设计了第一代 32 位、6MHz 的处理器,它支持的指令比较简单,虽然功能远不如英特尔处理器强大,但是功耗小、价格便宜。不过,当时处理器行业的霸主是英特尔,占据着 PC 处理器市场绝大多数的市场份额。ARM 处理器能力不足,根本无法撼动英特尔在 PC 处理器的市场份额。

    因此,ARM 找到了嵌入式设备市场,但是整个 20 世纪 90 年代,ARM 公司的业绩平平,处理器的出货量徘徊不前。但在而在 2007 年之后,随着智能手机时代的到来,ARM 处理器迎来了快速增长,有资料显示目前全世界 95% 的智能手机和 80% 的相机都用到了 ARM 的技术。目前 ARM 也已经成了嵌入式芯片领域的实际标准。ARM 也因此成为了一家能够与英特尔抗衡的企业。

    显然,ARM 的成功经验就是找准方向,然后就是咬定青山不放松地等风来,这对 AI 芯片企业而言,显然也是一个好建议。

     
    共同学习,提升自己,讨论请留言
  • 相关阅读:
    JVM 常量池、运行时常量池、字符串常量池
    JVM Direct Memory
    JVM 方法区
    JVM GC Roots
    jvm 堆
    jvm slot复用
    JVM 虚拟机栈
    JVM 程序计数器
    java打印树形目录结构
    java 通过反射获取数组
  • 原文地址:https://www.cnblogs.com/guanghuan33/p/8574224.html
Copyright © 2011-2022 走看看