收藏我们联系我们
动态信息
公司新闻
行业动态

阿法狗闹革命,巨头扎堆深度学习,中国AI抗旗者在哪?

发布时间:2016-3-15

电子设计模块

 在AlphaGo阿法狗第一局战胜围棋高手李世石后,英国《金融时报》中文版头条文章为:互联网终结,人工智能崛起。此时此刻,互联网时代的领先者和弄潮儿不落窠臼,一场革命就要到来,他们似乎正在抛弃互联网:

 

2015年和2016年,整个Google都在推动一件事——改名Alphabet,希望彻底脱掉互联网公司的标签,在原来的搜索引擎、YouTube和Android之外,将Calico(生命工程相关)、Google Ventures(创新投资部门)、GoogleX(研发自动驾驶汽车、智能隐形眼镜和提供互联网服务的热气球等)都归到Alphabet旗下。Google似乎已经意识到“互联网”时代正在终结。

 

同样在此刻,全球最顶尖的精英也在抛弃互联网——斯坦福、MIT(麻省理工)、CMU(卡内基梅隆)、伯克利四所名校人工智能专业的博士生第一份offer(工作合同)已经可以拿到200-300万美金。掠夺这些人才的公司大体上在一个比较小的范围内,Google(现更名Alphabet)、Facebook、IBM、苹果、微软、亚马逊、特斯拉…一长串的金光闪闪的公司。

 

互联网的精英人才在硅谷现在的起薪应该是20万美金左右。10倍!还有什么比工资更敏感的价值判断呢?这种人才军备竞赛情况在商业历史上从来没有发生过。

 

阿法狗和Atlas机器人的相继出现,把即将到来的人工智能从幕后推送到幕前,谷歌在为这个全新的“人机智能时代”蓄势,一如当年的美国集中西方最优秀的科学家开启了震惊全球的“曼哈顿计划”。

 

AlphaGo在短短几个月实现性能的大幅提升,用五个月走完了IBM“深蓝”4年的路,这样惊人的学习能力是人类可望而不可及的。美国启动了“脑研究计划”(BRAIN Initiative)、欧盟启动了“人类大脑工程”(Human Brain Project),目前全球人工智能企业已经超过了900家,总估值超过87亿美元。

 

近年来,深度学习(deep learning)已经在图像识别、语音识别等领域获得了一些应用。目前深度学习技术应用最多的还是视觉领域,即对图像和视频的分析。在图像分析方面,比如人们熟悉的人脸识别、文字识别和大规模图像分类等,深度学习大幅提升了复杂任务分类的准确率,使得图像识别、语音识别以及语义理解准确率大幅提升。

 

Google已经着手开发人工智能的实际应用,多次公开场合讨论过深度学习技术,比如深度学习是如何帮助Android手机提高语音识别准确率;谷歌自动驾驶通过深度学习识别道路、交通信号灯、路标等。

 

据悉,谷歌与半导体新创企业Movidius展开合作,正在开发配备“深度学习(Deep Learning)”人工智能最新技术的智能手机。如果智能手机内置图像识别功能,就可以即时本地处理图像和识别被摄体。人脸识别支付、标识和招牌翻译等手机的各种新用途将成为可能。

 

芯片商扎堆深度学习,高通打出骁龙820

 

然而,对于半导体产业来说,最重要或许也最实际的问题是:深度学习将会深入智能手机、可穿戴设备或是自动驾驶汽车中使用的微型芯片吗?也就说,我们得让更小的设备具备深度学习的能力,使其得以实现高性能与低功耗才是关键。

 

结合用于侦测运动和音频信号的传感器、快速的存储器访问,以及高功效的数据处理方法,这些系统可以拥有真正的“认知”能力,甚至在不远的将来构成一个用于人工智能移动设备的平台。同时,重要的是优化现有的架构来实现“智能视觉”功能,比如3D深度图和感知、物体识别以及增强现实,还有一些核心的计算图像学功能,比如图像缩放、HDR、图像再对焦,以及微光图像增强。

 

现在已经有充份的证据显示芯片供货商对深度学习的兴趣不断增加,卷积神经网络(CNN)正广泛地应用在影像与视频辨识领域。

 

“毫无疑问地,深度学习确实是改变游戏规则的一大突破,”嵌入式视觉联盟(EVA)创办人Jeff Bier以计算机视觉为例表示,深度学习具有强大的影响力,“必须说的是,目前它还只是一种经验领域。人们正在尝试不同的东西。”

 

高通去年推出了首款可‘模拟人脑’的Zeroth认知运算平台——具有“计算机视觉、设备上深度学习、可辨识场景与对象的智能相机,以及阅读文本与手写”的能力,并宣称骁龙820是一颗智能芯片。

 

Nvidia在去年三月的GPU技术大会上使用汽车和先进驾驶辅助系统(ADAS)作为应用重点,配合Elon Musk的意见和评论,希望表明自动驾驶汽车的挑战几乎已被完全克服了。另一方面,随着时间的推移,加上一些着眼于降低功耗的调整与改良,无处不在的3D感知、3D跟踪,以及图像搜索等许多技术和应用正在快速进入智能手机,以及其他以电源或电池供电的嵌入式系统中。

 

DSP IP平台授权厂商CEVA公司宣布推出实时神经网络软件框架CEVA深层神经网络,以简化低功耗嵌入式系统中的机器学习部署。包括用于图像分类、定位和目标识别的实时示例模型,用于目标和场景识别、先进驾驶辅助系统(ADAS)、人工智能(AI)、视频分析、增强现实(AR)、虚拟现实(VR)和类似的计算机视觉应用。

 

飞思卡尔收购计算机视觉IP供应商CogniVue。CogniVue总部位于加拿大渥太华,是一家从事影像认知IP开发的企业,过去4年是飞思卡尔最新驾驶辅助系统(ADAS)单芯片(SoC)解决方案主要视觉IP的供应商。

 

TI、Nvidia、英飞凌、高通、谷歌等大厂都在进行自动驾驶汽车中使用的微型计算机视觉芯片设计的研究,致力于开发针对神经网络(CNN)优化的SoC架构。其中最厉害的是以色列公司——Mobileye——他们可以提供最完整解决方案。

 

为了实现视觉类芯片的深度学习应用,芯片供货商用尽了从CPU、GPU到FPGA和DSP的一切,有关CNN的争论才刚刚开始。

 

 

人工智能型移动芯片面世还要多久?

 

“你不需要做出决定,因为深度学习将会为你做决定。”在深度学习架构中,你可以将所有的步骤整合于一。

 

学习和训练过程先在专用设施完成,例如利用数据中心的超级计算机。然后,将第一阶段中的大量数据集转为‘设定’和‘协同效率’应用到嵌入式系统中。

 

随着许多图像处理与增强功能也都使用计算机视觉技术,计算机视觉和图像处理技术之间的区别正在变得越来越模糊。最直接的例子就是多帧图像增强功能,比如HDR、图像缩放与再对焦--拍摄多个连续的图像,然后将它们融合在一起,得到更高质量的画面。

 

虽然我们称之为“图像增强”,但这其实涉及大量的计算机视觉处理来“register”图像,既完成两帧或三帧画面之间的匹配。现在,用户认为这种基本功能是理所当然的,但其实它需要非常强大的处理能力,使得对于专门的、高性能的数字信号处理 (DSP)的需求将会增加。

 

高通公司(Qualcomm) 在Uplinq 2013上发布了文章,很好地描绘出用于各种不同处理功能的像素功率和时间关系。图中展示了三个处理器,包括一个在1.2 GHz下运行的单核CPU、一个四核CPU,以及一个在690 MHz下运行的DSP。

 

 

阿法狗闹革命,巨头扎堆深度学习,中国AI抗旗者在哪?_ESMCOL_1
图:描绘不同处理器在处理每个像素时需要的处理能力和时间,表明了DSP结合CPU用于视觉处理的优势。为了优化功耗和性能,结合CPU、DSP和GPU可能是总体来说最好的方法。

 

然而,随着我们转向在移动平台上实现类似人类的视觉、人工智能和增强现实应用,可能需要重新思考所需的处理架构。结合传感器融合和先进深度学习算法(比如CNN),这些非常先进的计算密集型应用将提供更具环境感知和情境感知的用户体验,但是在电池寿命方面却要作出取舍。

 

设计人员面临的挑战,是一方面要实现具有智能感知能力的设备,同时在另一方面维持可接受的电池寿命。有几种方法来实现这一点。例如,可以使用来自高通或Nvidia的GPU来支持CPU。这已经在许多智能手机中实现了。然而,降低功耗这一持续性的强制需求驱使我们将特定的处理密集型功能分散给针对视觉处理进行优化的DSP处理器。在处理物体识别和跟踪时,对比当下最先进的GPU簇群,使用这种方法可以节省高达9倍的功耗。

 

然而,即使具备这种功耗水平,移动设备仍然不太可能很快地使用面部识别来进行人群搜索,因为此功能对于处理能力的要求还是太高了。不过,低功耗处理器和经过特定优化的处理器架构的面世带来了希望,使得我们在这个领域内正在取得实质的进展。这类进展是MIT Technology Review将深度学习称为2013年十项技术突破之一的原因所在。除了GTC上进行了相关演示,微软、百度,以及Cognivue也展示了一些研究成果。此后,这个领域中还有其他长足发展。

 

此外,Aziana (澳大利亚)最近宣布与BrainChip(美国加州)合并,后者是专门以硬件方式实施人工智能的企业,并已经着眼于开发用于移动平台的人工智能。虽然支持强大处理能力的架构和超低功耗处理是至关重要的,但随着云连接变得更普及、更快捷,若我们将尽可能多的处理开销分配到云中,也是合乎情理的。这将会走向智能的处理性能分配。在云做最适合在云中处理的工作,在移动设备做最适合移动设备处理的工作,尽可能高效地依据架构分配功能,比如使用CPU来分配GPU和DSP之间的负载。用高通公司的说法,就是使用合适的引擎来做合适的工作。

 

 

 

“寒武纪”芯片——中国AI的抗旗者

 

世界排行榜榜首中国围棋抗旗者17岁的柯洁已向阿法狗约战,捍卫人类尊严。美国通过人工智能再次展示其科技领域全球领先地位,在中国AI研究的抗旗者在哪?实力几何?

 

在国内,大批科技公司也开始进入到这个市场。2014年科技部“863 计划”启动《基于大数据的类人智能关键技术与系统》项目,同时酝酿启动“中国脑计划”。在企业方面,阿里巴巴推出了国内首个可视化云计算智能平台 “DTPAI”;腾讯则推出了撰稿机器人Dreamwriter;新秀科大讯飞则在语音和语言方面也拥有了核心技术积累和产业基础。

 

而作为国内最早介入人工智能研发的企业之一,百度在人工智能研究方面的布局则远非几个独立产品或是几个垂直领域所能描述。2014年,百度在硅谷成立人工智能实验室,侧重于研究人工智能和深度学习的前沿技术,这使得百度在硅谷现有开发能力的基础上进一步增强了研究能力。与此同时,百度挖角谷歌大脑之父吴恩达,随即成立由吴恩达领衔的深度学习实验室,主攻智能驾驶和语音识别两个方向。

 

截止目前,百度人工智能实验室搭建了作为百度人工智能核心的“百度大脑”,融合了深度学习算法、数据建模、大规模GPU并行化平台等技术,实现了实时学习和成长,它拥有200亿个参数,构成了一套巨大的深度神经网络,是利用计算机技术模拟人的大脑的智慧,如学习、记忆、推理、搜索、分析、归纳、创新,甚至模拟和拥有人的情感、意识,使计算机或机器人能够胜任一些通常需要人类智能才能完成的复杂工作。

 

在核心处理器领域,中国科学院计算技术研究所陈云霁、陈天石课题组提出的深度学习处理器指令集DianNaoYu被计算机体系结构领域顶级国际会议ISCA2016(International Symposium on Computer Architecture)所接收,其评分排名所有近300篇投稿的第一名。2014年,陈云霁入选《麻省理工科技评论》35岁以下的全球最佳35名创新人士。

 

一同问世的还有全球首个深度学习处理器架构寒武纪。陈云霁在接受采访时表示,事实上,中国在智能这样的新兴领域和国外差距不大,甚至在智能芯片上是引领世界的。例如我们的寒武纪,美国的哈佛、斯坦福、MIT、哥伦比亚等高校都跟在我们后面做。谷歌甚至需要使用上万个x86 CPU核运行7天来训练一个识别猫脸的深度学习神经网络。将来如果使用了带有“DianNaoYu(电脑语)”指令集的“寒武纪”处理器,深度学习的运算速度会得到明显提升。

 

 

阿法狗闹革命,巨头扎堆深度学习,中国AI抗旗者在哪?_ESMCOL_1
 

 

陈云霁还表示,正在成立寒武纪公司,进行深度学习处理器的产业化,公司即将完成天使轮融资。相信我们的产品一旦流片,很多国内外公司都会非常感兴趣。