
据相关媒体
报导
,我国芯片90%依靠进口,曩昔十年累计耗资高达1.8万亿美元。即使依照较低的汇率折算,也现已远超10万亿元人民币。但是,这几年我国的创业者和投资者都逐步开端重视AI芯片,有观念以为在这个新的芯片范畴,我国可以说和国际现已在同一个起跑线上了。那么,我国AI芯片中的玩家究竟都有谁呢?咱们今日就来盘点一下。
中星微
早在2016年,
中星微
便宣告他们的我国首款“星光智能一号”嵌入式NPU现已在当年3月6日完结了量产。据介绍,“星光智能一号”VC0758选用了“数据驱动”并行核算的架构,可以支撑Caffe、TensorFlow等多种神经网络结构,支撑AlexNet、GoogleNet等各类神经网络。单颗NPU(28nm)能耗仅为400 mW,极大地提升了核算才能与功耗的份额,可以广泛运用于智能驾驭辅佐、无人机、机器人等嵌入式机器视觉范畴。
不过,业界也有观念称这不是一个专为加快Neural Network而开发的处理器,该观念以为其内部集成了多个DSP核(其称为NPU core),经过SIMD指令的调度来完结对CNN、DNN的支撑,以这个逻辑,好像许多芯片都可以叫NPU。
地平线机器人
Horizon Robotics(地平线机器人)由前百度深度学习研究院负责人
余凯
兴办,努力于打造根据深度神经网络的人工智能“大脑”渠道-包含软件和芯片,可以做到低功耗、本地化的处理环境感知、人机交互、决策控制等问题。2017年末,该公司现已发布了面向智能驾驭的征途(Journey)1.0处理器和面向智能摄像头的旭日(Sunrise)1.0处理器。这是彻底由地平线自主研制的人工智能芯片,选用地平线的第一代BPU架构——高斯结构,具有全球抢先的功能:可实时处理1080p@30视频,每帧中可一起对200个方针进行检测、盯梢、辨认,典型功耗1.5W,每帧延时小于30ms。
寒武纪
2016年,寒武纪科技于北京中关村和上海临港注册建立,这一年里,寒武纪科技面向产业界发布了商用深度学习处理器IP产品寒武纪1A。为了让芯片处理速度变得更快,寒武纪还专门为1A规划了专门的存储结构,并规划了彻底不同于通用CPU的指令集,在1GHz主频下理论峰值功能为每秒5120亿次半精度浮点运算,对稀少化神经网络的等效理论峰值高达每秒2万亿次浮点运算。在若干要害人工智能运用上实测,寒武纪1A到达了传统的四核通用CPU 25倍以上的功能和50倍以上的能效。
2017年,集成了寒武纪技能的华为Kirin970手机芯片和
Mate 10手机
全球发布,实测结果表明寒武纪科技与华为的联合研制成果在图片辨认速度上逾越了搭载A11芯片的iPhone X。而上一年末,寒武纪又发布了3款新一代AI处理器:面向低功耗场景视觉运用的寒武纪1H8(能效比为1A的2.3倍);具有更广泛通用性和更高功能的寒武纪 1H16 以及面向智能驾驭范畴的寒武纪1M。
别的,寒武纪还发布了面向云端的高功能智能处理器产品线:寒武纪高功能机器学习处理器芯片“寒武纪 MLU100”和“寒武纪 MLU200”,这两款芯片别离侧重推理和练习两个用处。
此外,寒武纪还表明其未来的芯片产品将全面支撑多样化的机器学习运用,而不只仅是常见的深度学习。
深鉴科技
深鉴科技建立于2016年,努力于成为国际先进的深度学习加快计划供给者。该公司声称具有国际顶尖的神经网络紧缩、编译、系统结构与指令集结构规划、FPGA开发和系统集成的完好开发才能。
现在,深鉴科技现已自主研制了亚里士多德架构的DPU (Deep Learning Processor Unit) 。据了解,DPU是面向深度学习(DL)运用的可编程通用核算渠道,可以处理比方图画和视频的分类 、切割、检测 、盯梢 等使命。DPU界说和完结了一套用于映射深度神经网络 (DNN) 算法的高度优化可编程指令集,在完结高功能、高能效比方针的一起统筹通用型和灵活性,不只支撑现有绝大部分盛行的卷积神经网络 (AlexNet、VGG,、GoogLeNet、ResNet,Faster-RCNN, SSD, YOLO等),一起具有高度可扩展性,在DPU指令集供给支撑的基础上可以无缝运转其它用户自行扩展或衍生的神经网络。
现在,深鉴科技也现已推出了多款人工智能加快模块,2018年还将推出首款SoC系列芯片——听涛Tingtao。
西井科技
西井科技
建立于2015年5月,是一家开发“类脑神经元芯片+算法”的科技公司,努力结构一种彻底跳脱于冯诺依曼结构的神经形状的芯片结构——即仿照人脑神经元作业原理而制造出的芯片,它既具有人脑的学习才能,又具有强壮的特定运算才能,仅需一块邮票巨细的芯片,就能仿照人类大脑在短时间内处理海量的感官信息。据称该芯片具有低功耗,高功率,无需联网等优势。现在,西井科技现已推出了两款芯片:
- 可仿照5000万等级“神经元”的仿生类脑神经元芯片——deepsouth(深南),功耗为传统芯片在同一使命下的几十分之一到几百分之一。
- 具有12800万个神经元,经过专属指令集调整芯片中神经元资源分配的深度学习类脑神经元芯片——deepwell(深井)。
云天励飞
云天励飞创始人陈宁曾是中兴通讯 IC 技能总监,带领过 400 多人的芯片研制团队。此外,他仍是国家 ” 千人计划 ” 特聘专家,国侨办 ” 要点华裔创业团队 ” 带头人。2014 年 8 月,陈宁创建云天励飞,主打智能视频与图画辨认。
该公司一大特征就是其规划开发了一款名叫IPU (intelligent Processing Unit)的芯片,专门面向深度学习的多层神经网络的核算并将它的运算功率提升到100倍以上,经过从头界说一套指令值,使它运转和核算深度神经网络可以愈加高效。
有音讯显现,该芯片将于本年出货。
Think Force
Think Force建立于2017年,据介绍其团队中心成员首要来自IBM,AMD,INTEL, ZTE等业界龙头芯片企业,且都具有十年以上的专业芯片研制规划阅历。该公司首要规划交融一流AI算法和先进制成工艺的智能芯片,并以此构建人工智能硬件渠道,供给一站式职业运用处理计划。
据称,该芯片选用自主研制的微内核ManyCore架构,能完结AI云虚拟化调度在芯片级的完结,芯片虚拟化技能在需求弹性核算的场景中可以成倍进步芯片运用率。别的,结合自主研制的固件和相关SDK可以完结关于各类神经网络模型的核算加快,加快单元实践功率在90% – 95%之间,相关于Nvidia的干流核算卡能到达5倍以上的功耗和本钱节约。
比特大陆
近年来比特币大火,而这也带来了挖矿职业的昌盛,而
比特大陆
就是在这次挖矿职业迸发中敏捷兴起的企业,该公司凭仗自己规划的比特币挖矿专用ASIC芯片,一举跃入2017年我国IC规划公司前五的队伍。据称,现在全球80%乃至90%的矿机都由该公司供给。而上一年11月底比特大陆则发布了一款名叫 BM1680 的 TPU 张量加快核算芯片,正式进军AI芯片范畴。据了解,该芯片可适用于CNN、RNN和DNN等多种神经网络的猜测和练习,其加快核选用了改进型Systolic架构技能,与 Google TPU 系统架构相似。
数据处理方面,该芯片浮点运算才能峰值可达2TFlops,而峰值功耗则为41瓦,均匀功耗为25瓦。
启英泰伦
成都
启英泰伦
科技有限公司是一家专心于人工智能芯片规划及配套智能算法引擎开发的公司,它于2016年9月推出了专用的根据ASIC架构深度神经网络智能语音辨认芯片CI1006,并已完结了量产和出货。CI1006是根据ASIC架构的人工智能语音辨认芯片,包含了脑神经网络处理硬件单元,可以完美支撑DNN运算架构,进行高功能的数据并行核算,可极大的进步人工智能深度学习语音技能对很多数据的处理功率。
据介绍,这是一款专用于智能语音辨认芯片计划,包含了脑神经网络处理硬件单元,可以完美支撑DNN运算架构,功能适当于数十个CPU核的并行核算才能,本钱不到通用芯片计划本钱的1/2,功耗则在1/10以下。现在,根据该芯片的单/双麦克风计划均可以完结十米辨认间隔,辨认精度在90%以上。
耐能科技
耐能(Kneron)
于2015年由台湾人创建于美国圣地牙哥,创始人刘峻诚表明,公司的中心竞争力在于主打轻量级的NPU,能耗比可以做到100mW到300mW,最新的一款产品乃至可以到10mW以下。并且其芯片尺寸也比较小,比方耐能(Kneron)于2016年推出终端装置专用的人工智慧芯片——神经网路处理器(Neural Processing Unit,NPU),相较于干流的神经网络芯片,体积可以缩小至1/40。
深考虑科技
深考虑
是一家专心于类脑人工智能与深度学习中心科技的高科技公司。中心团队由来自于中科院自动化所、软件所、核算所、微电子所等中科院院所人工智能、机器学习方向的资深科学家组成。公司现在现已推出了ARGUS DPU深度学习处理器,可为专用范畴(如智能视频处理、安防监控、ADAS、医疗图画处理等) 的人工智能与深度学习核算供给高功能硬件加快,赋予智能终端高功能、高牢靠、实时的深度学习核算才能。除各类深度学习算法外,也支撑各类传统算法结构(如OpenCV),并供给丰厚的接口满意客户产品的运用需求。ARGUS DPU支撑处理模组级联,以成倍进步实时算力。不过,现在该公司并没有泄漏详细的功能参数。
异构智能
异构智能
是由闻名人工智能专家、核算机博弈专家、异构智能专家吴韧博士挂帅,带领一批人工智能、深度学习和异构核算范畴顶尖的技能人才组成团队,于 2015 年 8 月在硅谷创建的公司,专心于供给“ASIC 芯片+练习模型”的全栈式 AI 处理计划。本年CES期间,该公司发布了其第一款高功能、低功耗的 AI 芯片 NovuTensor。
异构智能方面表明这是到现在国际上仅有一款可以实践运转的、功能到达干流 GPU/TPU 水平而功能/功耗比却远超干流 GPU/TPU 的芯片——在功耗 12w 的情况下,NovuTensor 每秒可辨认 300 张图画,每张图画上,最多可检测 8192 个方针,比较现在最先进的桌面服务器 GPU(250W,每秒可辨认 666 张图画),仅运用 1/20 电力即可到达其功能的 1/2;而比较现在最先进的移动端或嵌入式芯片,相同用电的情况下,功能是其三倍以上。
写在最终
需求提及的是,声称“国际首款手机AI芯片”的华为麒麟970并未收录到本文中,由于麒麟970运用的是寒武纪的神经网络处理单元(NPU),在物体辨认方面的一整套嵌入式AI处理计划则来自
中科创达
。无论如何,AI芯片范畴开展得适当快,未来也必然将有更多的AI芯片企业入局。我国的这些企业能否破除我国芯片高度依靠进口的魔咒呢?咱们拭目而待。
相关阅览:《
AI 芯片,是金山仍是泡沫?
》题图来自123RF