本届集微半导体峰会的“高端通用芯片专场论坛”,集微咨询携手高通、Imagination、黑芝麻、寒武纪等知名芯片设计、IP厂商以“构建高端芯片生态,创‘芯’共赢”为主题剖析高端芯片产业现状与发展,构建新生态。

在寒武纪的演讲中,刘道福主要分享了人工智能时代的发展有赖于且离不开专用芯片的支持,以及寒武纪在该领域的深度战略和产品布局。

人工智能时代,算力决定智能化水平的上限

从1956年“人工智能”定义在达特茅斯会议上正式诞生至今,人工智能在发展历程上经历了几次大起大落。

20世纪50年代,提出了现在的深度学习或者神经网络的雏形——第一款神经网络Perceptron,但由于缺乏好的多层神经网络训练算法,并没有得到很好的发展。

直到20世纪80年代, BP算法出现使得大规模神经网络的训练成为可能,但是受限于算力无法满足多层神经网络的需求,以及算力的成本高昂,AI进入第二次低谷。

到2000年之后,摩尔定律、芯片技术的发展,以及异构计算的出现,让整个算力尤其是并行和异构算力得到了长足发展,加上互联网数据的积累,解决了深度学习的数据和算力问题,让深度学习步入飞速发展期。

也正是在这个时候,2008年,寒武纪创始团队成员开始从事处理器架构和人工智能的交叉研究。刘道福表示,如果说,在传统工业时代,电力决定了整个工业发展的上限,成为了当时非常重要的生产资源。那么,步入人工智能时代,则是由算力来决定智能化水平的上限,以此支持人工智能在各行各业的落地。

人工智能需要专用的智能芯片

“人工智能的发展离不开三大要素,即智能算法、海量数据和智能算力。”当然,伴随新技术日新月异,这三大要素也需要不断突破。

首先,算法本身需要突破,因为只有不断优化人工智能算法,融合数据、算力后,才能更好地把价值发挥出来。

其次,海量数据的资源需要突破,一般来说,为达到良好效果,神经网络算法往往需要很多层,且参数量巨大,这些都需要海量的数据。以金融领域为例,其应用很广的自然语言处理模型bert,其训练大概需要33亿文本语料,而语音识别也需要高达数百小时的语料进行训练等等。

最后,芯片的算力需要突破,海量且复杂的数据需要高算力芯片处理,同时,人工智能技术需要更大算力和更高能效比的智能芯片。

 

刘道福表示,因此,人工智能需要专用的智能芯片,复杂的智能算法和海量的数据都依赖于高能效比的专用智能芯片来加速处理。

纵观芯片技术的发展,往往都是随应用驱动而演进。最初主要应用是文本处理,一般需要传统的通用计算,而CPU就是为通用计算而生,不适合智能计算中常用的张量运算,而且算力较低,并行计算性能弱,另外,性能功耗比较低,不适合大规模部署。尔后,随着图像或桌面应用开始出现,而CPU难以高效地满足图形计算的计算模式,为此GPU诞生了,包含大量的图形计算单元,虽然增加了智能计算中常用的张量单元,但占比较小,性能功耗比大于CPU,但相比专用智能芯片有差距。

如今,人工智能计算应用越来越广泛,其中的计算模式与图形计算、通用计算都不同,因此需要针对智能计算进行优化的处理器架构。而寒武纪MLU则是更适合深度神经网络计算的芯片架构,为人工智能而生,更低的TCO和优异的性能功耗比,满足业务部署对吞吐率和时延的苛刻要求。

刘道福谈到,寒武纪的核心能力是AI芯片的处理器架构,基于此,公司关注跨行业多场景对AI芯片算力的需求。例如,智能物联网领域,典型算力需求是小于1TOPS;消费电子领域是1~20TOPS;而自动驾驶随着级别升高,算力需求在20~2000TOPS;至于数据中心及云计算等业务,规模越大,用户访问越多,需要的算力就越大,最终可能在POPS到EOPS。

寒武纪云边端一体化芯片布局

寒武纪是目前市场上少数几家全面布局并掌握云边端一体化产品的企业之一,能提供终端智能处理器IP、云端AI芯片及加速卡、边缘智能芯片及加速卡,以及基础系统软件平台Cambricon Neuware。

刘道福特别强调,寒武纪的处理器架构无论在云端,边缘端,还是终端,甚至包括车端都能互相通用。寒武纪在终端有一整套完善的工具,支持开发好就可快速部署。可以说,云边端一体软件平台Cambricon Neuware彻底打破了云边端之间的开发壁垒,兼具高性能、灵活性和可扩展性的优势。在Cambricon Neuware的支持下,能轻松实现跨云边端硬件平台的人工智能应用开发,以“一处开发、处处运行”的模式大幅提升人工智能应用在不同硬件平台的开发效率和部署速度。

公司现有核心产品包括终端智能处理器IP、云端训练芯片思元290(MLU290)和思元270 (MLU270)、边缘端智能芯片思元220(MLU220)。这些核心产品的应用包括机器视觉、语音技术、自然语言、搜索推荐等各种场景。

AI芯片让机器更好的理解和服务人

AI芯片本身而言,是一个很底层的基础设施,最终的价值需要体现在终端应用和方案上。人工智能技术一般分为三层:第一是基础层,主要是以硬件为载体的AI芯片;第二是技术层,可能是计算机视觉、语音识别、自然语言处理、知识图谱、搜索推荐;最上层是智慧应用层,包括自动驾驶、智慧教育、智慧电力、机器人、质检等等。对于不同的层面,寒武纪都会布局或者配合合作伙伴进行布局。例如技术层,寒武纪会和合作伙伴适配算法,在应用层,寒武纪也有很多应用生态的合作伙伴。刘道福表示,如今,寒武纪已经有大量方案落地,包括互联网、铁路、金融、交通、电力等领域。

回归公司的初衷和愿景,刘道福表示:“寒武纪的直接服务对象是机器和算法,做机器里面核心的AI计算芯片,让机器的智能算力更高,运行智能算法能效更好。同时,寒武纪会和硬件和算法合作伙伴一起,打造各类场景应用下智能解决方案,最终让机器能更好的理解和服务人。”