一款高度通用和算力普惠的AI芯片。
2019年9月25日,在阿里巴巴的云栖大会上,阿里旗下半导体公司平头哥正式发布了榜首颗自研芯片——含光800,这是继玄铁和无剑之后阿里在芯片范畴的又一严峻布局。
一组数据标明,含光800的发布标志着AI芯片功能史再度被改写。在业界规范的ResNet-50测试中,含光800推理功能到达78563 IPS,比现在业界最好的AI芯片功能高4倍;能效比500 IPS/W,是第二名的3.3倍。
一起,比照揭露数据(针对ResNet50模型一秒可以处理图片的数量)得知,含光800展示的功能是是NVIDIA Tesla V100的10倍,NVIDIA Tesla T4的15倍,是运用最广的NVIDIA Tesla P4的46倍。
不过,阿里巴巴方面表明,“含光800并不会售卖,旨在经过阿里AI云服务供给算力,可以看作‘云端售卖’。平头哥致力于做普惠芯片,无剑SoC渠道和玄铁处理器IP来协助企业下降芯片规划门槛;含光800经过阿里云AI云服务的方法让企业随时随地可以享用高功能核算服务。”
含光800的发布标志着平头哥端云一体全栈产品系列开端成型,其包括处理器IP、一站式芯片规划渠道、以及AI芯片,完结了芯片规划链路的全掩盖。
“在全球芯片范畴,阿里巴巴是一个新人,玄铁和含光800是平头哥的万里长征榜首步,咱们还有很长的路要走”,达摩院院长张建锋这样点评。
“无形却微弱”的算力
“平头哥很硬,含光很强”,这句话从命名方法便暴露无疑。
平头哥,本名蜜罐,原本是生活在非洲等区域的一种动物,被吉尼斯世界纪录称为“世界上最临危不惧的动物”,其“不要怂就是干”的性情被马云一眼相中,从此平头哥便成为了阿里芯片公司的代名词。
而含光则是上古三大神剑之一,该剑含而不露,光而不耀,代表着含光800带来的无形却微弱的算力。
含光800选用12nm工艺,具有170万晶体管数量,推理功能达78563 IPS,比现在业界最好的AI芯片功能高4倍;能效比500 IPS/W,是第二名的3.3倍,首要运用于云端视觉处理场景,可以在1秒内处理7.8万张图片。
在杭州城市大脑的事务测试中,1颗含光800的算力相当于10颗GPU,这关于未来才智城市交通等AI运用落地场景来说,无疑是巨大的源动力。
据悉,平头哥在十分短的时刻内便完结了芯片的规划和流片整个进程,7个月完结前端规划,随后仅用3个月便成功流片。
要知道芯片规划是一个杂乱的体系工程,单纯完结规划并不意味着就可以流片成功,这是职业的深水区。而流片失利就意味着硬件规划需求推倒重来,这比软件出BUG问题愈加严峻。一般芯片公司需求做两次(engineering sample、production sample)或屡次才干流片成功。
可是,流片成功也并不代表就可以直接商用了,它还需求经过杂乱的测试验证,当各项方针都符合实际场景需求后才干真实商用。
PingWest品玩了解到,平头哥之所以可以如此快速研宣布如此高功能的AI芯片,可以总结为以下两方面。
榜首,比较依据冯诺依曼结构的传统通用处理器(比方x86 CPU和GPU),针对某种特定的需求而专门定制的ASIC架构NPU专用加快器关于运用场景更具有针对性。
针对特定场景和算法的定制意味着履行特定算法时能取得更高的功率和功能,可是这种较为单一的算法也一起意味着打造AI芯片理论上要比打造传统CPU和GPU门槛低得多,但这并不意味着每个芯片厂商都能像平头哥相同做到最强。
现在,市面上许多ASIC架构NPU一般只在十分清晰的场景下才干够体现优异,而在场景的迁移性和算法通用性方面大打折扣。
比较之下,含光800不只完结了一起兼容海量的图画查找、城市大脑范畴的视频辨认、以及才智医疗范畴的医疗印象辨认等不同核算需求环境,还针对这些丰厚的场景发掘出了极大的核算优化潜能。
值得一提的是,传统半导体巨子打造AI芯片,会有开发者生态的包袱,但平头哥团队方针专注,即完结最强算力,把硬件才干彻底开释。
第二,虽然这是阿里平头哥的榜首款自主研制的芯片,可是事实上平头哥研制芯片并非从0开端。
“在阿里达摩院的算法以及阿里巴巴集团硬件根底设施多年技能沉积之上,含光800重构了芯片的软硬件技能栈”,阿里巴巴方面介绍。
“AI芯片的差异化规划首要体现在硬件架构和软件算法上,二者需求高度适配才干发挥芯片的最大价值”,有业界剖析人士指出。
“现在,传统CPU、GPU在深度学习推理使命上并没有彻底发挥硬件才干,例如GPU架构首要针对图画处理规划,其硬件结构和软件生态简直固化,因而对AI使命很难有深度优化。”
PingWest品玩发现,含光800的功能打破就是得益于软硬件的协同立异,打破了硬件架构和软件算法之间的距离。
详细来看,含光800硬件层面选用自研芯片架构,经过推理加快等技能有用处理芯片功能瓶颈问题;软件层面则集成了达摩院先进算法,针对CNN及视觉类算法深度优化核算、存储密度,可完结大网络模型在一颗NPU上完结核算。
以芯片能耗为例,能耗是AI芯片的职业通病,而平头哥自研架构可大幅削减对内存的拜访,在确保极致功能的情况下,把芯片功耗降到最低水平。
平头哥首席科学家、阿里巴巴高档研究员元尊则将平头哥研制AI芯片的详细优势归结为“ABCDE”五方面,即Algorithm 算法、Big Data 大数据、Computing 安全安稳的核算力、Domain knowledge 专业范畴常识、以及Ecosystem 生态。
“具有ABCDE的阿里,比只要C的其他芯片公司,天然更简单更快速站上AI芯片C位”,元尊坦言。
已运用于阿里中心事务
关于阿里AI生态而言,含光800绝不是单纯的做芯片,而是为全球排名前三、亚太排名榜首的阿里云供给强壮的算力支撑,以满意阿里巴巴集团内部场景的需求,一起含光800也将运用阿里云对外(企业)输出其强壮的AI算力。
据悉,依据含光800的AI云服务在发布会当天便正式上线,比较传统GPU算力,含光800性价比提高100%。
依据云栖大会的现场演示,含光800现已开端运用于阿里巴巴的内部中心事务中,比方城市大脑处理杭州主城区交通视频、拍立淘产品库图片辨认、以及优酷视频修正和剖析等。
PingWest品玩了解到,假如运用传统GPU,城市大脑实时处理杭州主城区交通视频所需GPU数量约为40颗,延时为300ms;而假如运用含光800,则只需4颗,一起延时降至150ms。
另一方面,阿里电商渠道拍立淘产品库每天会新增10亿产品图片,假如运用传统GPU,其辨认时刻需求1小时;而假如运用含光800,则只需5分钟,功率提高12倍。
未来,含光800的算力也将浸透至医疗、自动驾驶、才智城市等各个笔直职业。
含光800将协助企业以更低的本钱获取高功能算力,推进企业事务立异。关于受限于算力瓶颈的企业而言,含光800可以更高效地运转更杂乱、更先进的算法,让企业再也不会为根底算力忧愁。
PingWest品玩得悉,为了给运用场景供给更好的算力芯片,平头哥团队在曩昔一年做了许多工作,不断探究芯片与运用场景之间的交融。
作为全球进入AI运用最丰厚的科技厂商之一,阿里巴巴具有丰厚的AI运用场景,图画视频剖析、查找、引荐等事务场景都需求AI专用芯片供给更强壮的算力,其间图画、视频对算力的需求量最大。
环绕这一方针,平头哥针对场景深度定制了芯片的软硬件,例如自研了架构、软件编译器、结构、东西链等。
一起,后期也针对INT8数据类型做了很多优化,终究在功能、良率、功耗等方针上均体现杰出。
算力也要普惠
含光800的发布标志着阿里巴巴核算地图中铁三角的正式构成,AI+芯片+云核算将协助阿里在未来AI职业运用落地奠定夯实的根底,而这关于阿里来说仅仅一个开端。
PingWest品玩了解到,作为AI职业的领军企业,阿里现在正在打造完善的职业生态和开发者生态。
在云端,全球排名前三、亚太排名榜首的阿里云为平头哥服务企业供给了绝佳渠道,未来企业可以经过阿里云轻松获取含光800的强悍算力。
在端侧,平头哥已具有老练的生态体系, CK801、CK802、CK803、CK805、CK807、CK810、CK860等7款自研嵌入式CPU IP核均已得到大规模量产的验证,授权客户超100家,累计出售超十亿颗,广泛运用于机器视觉、工业操控、车载终端、移动通讯和信息安全等范畴。
此外,依据RISC-V架构的玄铁处理器以及无剑SoC渠道也已服务各职业企业,例如人工智能企业云天励飞和老牌芯片商炬芯科技等。
另一方面,平头哥还将建立芯片敞开社区,进一步为芯片工业供给敞开协作的渠道。
一起,跟着含光800的发布,平头哥端云一体全栈芯片产品宗族也已初现雏形,完结了芯片规划链路的全掩盖。
其间根底单元处理器IP,C-Sky系列、玄铁系列为AIoT终端芯片供给高性价比IP;一站式芯片规划渠道无剑SoC渠道集成CPU、GPU、NPU等,下降芯片规划门槛;而AI芯片含光800则经过AI云服务为人工智能场景供给极致算力。
这三大产品系列将构建端云一体的芯片生态,将会为企业供给普惠算力。
PingWest品玩了解到,在AIoT年代,因为强运用驱动和场景碎片化等特色,芯片公司依照传统方法规划芯片很难习惯未来的需求,平头哥期望经过端云一体芯片生态为职业供给普惠算力。
AIoT场景需求新的核算架构,需求安全、在线和智能等新特性,一切芯片都在面对晋级,这必将在芯片职业引起一波全新技能革命和工业浪潮。
不同于绝大多数芯片商,平头哥研制芯片的意图绝非卖芯片,而连续了阿里巴巴集团“让天下没有难经商”的愿景,拓荒了全新的商业形式——平头哥形式,致力于为企业供给普惠算力,成为了阿里巴巴独具特色的商业形式。
现在,平头哥还在研制运用于阿里云神龙服务器的SoC专用芯片,以满意更多场景的算力需求。未来,平头哥芯片产品形状还将进一步完善,例如云上AI练习芯片和端上AI推理芯片。
“阿里在芯片上的定位是端上做芯片根底设施,云上为企业供给普惠算力。例如,处理器是一切高端体系芯片都需求的根底产品,AI芯片是AI场景最高效的算力单元,阿里将投入重金打造好这些技能,一起构建运用生态”,阿里方面告知PingWest品玩。
“此外,平头哥还将持续开发操作体系、软硬件交融的算法、以及中心的IP等,并把这些共性的技能可以做好做精做出竞争力,并构成生态,然后敞开给芯片厂商规划产品,让他们依据高质量的根底设施打造芯片产品,有助于提高全体的工业竞争力”,阿里随即弥补道。