当前栏目:首页 - 新闻资讯

睿思芯科发布Pygmy芯片——基于RISC-V的64位可编程终端AI芯片

发布作者:Admin    发布时间:2019-03-19    浏览次数:0

睿思芯科于近期发布了Pygmy人工智能芯片。该芯片基于64位RISC-V指令集,具有高度可编程性能和低功耗、高能效的优点,可广泛应用于各种物联网终端AI inference场景。


Pygmy芯片介绍
Pygmy芯片基于最先进的RISC-V开源指令集,采用了多核异构架构,基于台积电28nm工艺。芯片中的CPU架构是睿思芯科基于RISC-V指令集设计而成,并针对多种AI应用进行了优化。芯片中的12个高度可编程AI加速引擎,也是基于睿思芯科自定义开发的RISC-V矢量扩展指令集设计而成。完全采用RISC-V指令架构,能够令SoC芯片各个功能模块更好协调,提升性能。

就具体性能而言,Pygmy中的RISC-V CPU具有64位位宽,主频600 MHz,基于RV64G指令集,支持双精度浮点运算,具备乘法器、除法器等运算部件,主控CPU功耗仅为10mW。对比市场主流厂商的同级别芯片,能耗下降85%,面积减少80%,相当于用一般的32位处理器的面积和功耗实现了64位处理器的性能。

Pygmy中的12个AI内核均为高度可编程,可支持各种主流AI算法。各个引擎可以灵活调配,令用户在高性能和低功耗间自由配置。芯片上还搭载了1 MB的SRAM,支持LPDDR4、SPI、UART等数据输入输出模式。通过前端+后端的全栈设计,Pygmy实现了能量等比计算(energy proportional computing),待机设计功耗不超过1mW。

Pygmy芯片具有低功耗、高能效的优点。Pygmy的能效比可达到4 TOPS/watt(Int8)。作为对比,Google第一代28 nm TPU以40watt功耗实现92 TOPS 算力,能效比约为2.3 TOPS/watt。Google使用的是固定的脉动阵列(systolic array),而作为基于RISC-V的多核可编程AI引擎,能效却可超过纯ASIC加速器的实现。这充分体现了开源开放的RISC-V架构为计算机架构的创新提供了巨大的空间、灵活性和潜力。

正是因为具备了高可编程性和高能效比,Pygmy能够将高性能的AI算力注入到低功耗的物联网终端的各类AI应用中,例如智能家居的人机交互、安防监控的图像识别、无人驾驶的传感器融合等场景。

Pygmy芯片中还支持硬件断点,可实时读取关键寄存器;睿思芯科在研制Pygmy芯片的同时,还自主开发了完善的编译器、SDK、工具链,基于GCC、LLVM等开源标准。这些工作能够支撑用户更好的进行二次开发。

这样一款高性能、高复杂度的芯片,睿思芯科的工程师仅用了创纪录的7个月时间,就完成了从零开始设计验证到交付流片的全部研发工作。芯片经过生产封测,回到公司第一天就能加电启动。这一方面得益于RISC-V极为干净简洁的优秀架构,另一方面更体现了睿思芯科研发团队超高的技术实力。

Pygmy 芯片亮相乌镇第五届世界互联网大会
在今年11月初在乌镇举办的第五届世界互联网大会上,性能如此卓越的AI芯片,获得了RISC-V缔造者、2017年图灵奖得主、美国两院院士David Patterson教授的赞赏。Patterson教授在大会上发表了演讲 "The Future of the Internet is the Cloud and Edge, which the Free and Open RISC-V Architecture Accelerates" ,其间特意以Pygmy为例,展示了RISC-V的先进和强大。

     x1.png
睿思芯科也携Pygmy芯片等展品参展世界互联网大会的"互联网之光博览会"。在主展馆的"中国开放指令(RISC-V)联盟"展台,睿思芯科的Pygmy芯片和全固态相控激光雷达晶圆片作为极具科技含量的展品,放置在展台最前端。Patterson教授到展台参观时,饶有兴致的仔细查看了这两件展品,并在睿思芯科的展台前与爱徒谭章熹博士合影留念。

     x2.png