道客优

1234
地表算力最强 AI 芯片,华为发布的昇腾 910 跟Google和英伟达有一拼
2019-08-24 来源:PingWest品玩 阅读:547

继发布鸿蒙系统之后,华为再一次展示了其前沿 AI 领域的技术能力。

8月23日,采用华为自研达芬奇架构的 AI 处理器昇腾 910 (Ascend 910)宣布商用,与其一同面世的还有配套的全栈全场景 AI 计算框架 MindSpore。

实测结果显示,昇腾 910 的半精度 (FP16)算力达到 256 Tera-FLOPS,整数精度(NT8) 算力达到 512 Tera-OPS,且芯片最大功耗仅为 310W,比此前设计规格的 350W 更低。

用华为轮值董事长徐直军的话来说,昇腾 910 作为算力最强的 AI 处理器当之无愧

算力即竞争力

昇腾 910 属于 Ascend-max 系列,是华为首款采用达芬奇架构的 AI 芯片,基于 7nm 增强版 EUV 工艺,其 AI 核集成了 3D 立方体计算引擎,可以在一个时钟周期内完成 4096 的乘加运算。

其实它的相关技术规格在去年 10 月的华为全联接大会上就已公布,彼时的半精度(FP16)256 TFLOPS 算力,相比英伟达的 V100 GPU 的 125 Tera FLOPS 还要高一倍。因此格外受外界关注。

为何要如此强调芯片算力?

目前华为已将昇腾 910 应用于实际的 AI 训练任务里。其中,在典型的 ResNet-50 网络训练中,昇腾 910 与 MindSpore 相配合,与现有主流训练单卡配合 TensorFlow 相比,性能提升近 2 倍。且每秒训练的图片数量从 965 张提升至 1802 张。

可以看到的是,随着数据和应用场景的不断增多,人工智能领域对于芯片的算力要求随之增加。来自第三方数据分析机构 OpenAI 近期数据表明,2012 年以来,人们对算力的需求增长六年超过 30 万倍,平均每 3.5 个月翻一倍,已经远超摩尔定律的发展速度——摩尔定律是每 18 个月翻一倍。

图片来自 OpenAI

人工智能领域有三要素:数据、算法和算力。数据为芯片处理的对象,算法即计算的边界,而算力则直接决定了计算效率对于华为来说,芯片是它们的硬实力,算力即它在 AI 领域的竞争力。

除了超高的算力之外,昇腾 910 还拥有高集成度和高速互联的特性。它集成了 CPU、DVPP 和任务管理器,因此它能独立完成 AI 训练流程。同时昇腾 910 集成了 HCCS、PCIe 和 RoCE 三种高速接口。其中最新的 PCle 吞吐量相比上一代翻了一倍。这些特性共同组成了算力最强的昇腾 910 处理器。

至于昇腾 910 的价格问题,徐直军并未直接透露,而是笑道:“具体定价还未定,但肯定比英伟达和谷歌低。”

除了全场景框架,还要生态

目前行业中已有 TensorFlow、Caffe 和 PyTorch 等主流 AI 框架,但它们都不支持全场景。这也是华为推出全栈全场景 AI 计算框架 MindSpore 的重要原因。

在去年华为全联接大会上,华为提出:AI 框架不仅应该开发态友好、运行态高效,还要能适应每一个场景。

而此次徐直军表示:能否大大降低AI应用开发的门槛,能否实现AI将无处不在,能否在任何场景下确保用户隐私得到尊重和保护,这些都与AI计算框架息息相关。

因此 MindSpore 框架有着针对性的提升:

  1. 不同运行环境下,MindSpore 框架架构可大可小 ,适应全场景不同资源预算独立部署;
  2. 框架通过协同经过处理后的、不带有隐私信息的梯度、模型信息,而非数据本身,在保证用户隐私数据保护的前提下跨场景协同;
  3. 将模型保护 Built-in 到 AI 框架中,模型安全可信。

光有全场景的框架还不够,徐直军宣布要把 MindSpore 在 2020 年 Q1 开源,像英伟达一样建立自己的生态。

“生态很重要,MindSpore 框架的重点就是要建造和其他框架一样有生命力的生态。”徐直军在发布会现场表示。

AI 生态离不开开发者,为了让吸引并帮助开发者一同促进 AI 产业生态的发展。MindSpore 还实现了一个创新:AI 算法即代码,降低开发者的门槛,可以显著减少模型开发时间。

以一个NLP(自然语言处理)典型网络为例,相比其他框架,用 MindSpore 可降低核心代码量 20%,效率整体提升 50% 以上。

此外,徐直军表示华为拥有其它优势,如华为在智能终端上的 HiAI 引擎,可帮助开发者来开发基于终端产品的AI应用和服务;并且华为所拥有的算力优势,与计算框架所实现的能力是其它框架无法比拟的。

接受采访时,徐直军还提到,MindSpore 不仅支持昇腾处理器,它也支持GPU、CPU等其它处理器。

在 MindSpore 的背后,是华为 AI 全栈战略的野心。即从端到边缘再到云,先有了底层的硬件,再有一套深度学习的框架,最后到上层应用使能。

去年华为发布了 AI 全栈战略,而今天徐直军宣布全栈全场景 AI 解决方案已经完成了构建。这标志着华为 AI 战略进入了新阶段。

有经验,还有计划

尽管华为 AI 战略刚发布一年,但当时发布的另一款高效计算低功耗 AI 处理器昇腾 310 早已商用,并在多场景下得到了广泛的应用。

华为云为昇腾 310 提供了图像分析类服务、OCR 服务、视频智能分析服务等云服务。对外提供 API 达 50 多个,日均调用量超一亿次,预计年底日均调用量超 3 亿次。超过100多个客户使用昇腾 310 开发定制 AI 算法。

此外,华为还陆续发布了 Atlas 系列产品,被应用于安防、金融、医疗、汽车等行业,有摄像机、无人机、机器人、MDC(Mobile Data Center)等产品形态。目前已在智慧交通、智慧电力等数十个行业里有落地解决方案。

昇腾 310 产品的应用,对于接下来昇腾芯片家族产品有着重要参考意义,而昇腾 910 仅仅是一个开始。

徐直军表示,面向未来,华为将持续投资,继续推进全栈全场景的 AI 解决方案,针对不同的场景,如边缘计算、自动驾驶车载计算、训练等场景,推出更多 AI 芯片。包括昇腾 320、昇腾 920 等芯片。

值得一提的是,面向终端的昇腾 Tiny 系列会在即将发布的麒麟 990 上应用。

道客优(www.daokeyou.top)提醒:本网站转载【地表算力最强 AI 芯片,华为发布的昇腾 910 跟Google和英伟达有一拼】文章仅为流传信息,交流学习之目的,其版权均归原作者所有;凡呈此道客优的信息,仅供参考,本网站将尽力确保转载信息的完整性,如原作者对道客优转载文章有疑问,请及时联系道客优,道客优将积极维护著作权人的合法权益。
推荐阅读: