ai软件字体库 阿里云推全球最大智算平台,自动驾驶AI训练提速170倍

作者|李水青

编辑|漠影

智东西8月30日消息,今日,阿里云宣布启用智能计算解决方案“飞天智算系统”,并开展位于承德和乌兰察布的两座超级智算中心,算力规模总计15EFLOPS(每秒1500亿亿次浮点运算),成为中国最大体量智算平台。

简单来说,智算中心是指专门面向人工智能应用的数据中心。

飞天智算系统是阿里云推出的智算中心升级方案,向下支持“一云多芯”,提供大体量融合算力;向上兼容通用及智能算力场景,以公有云和专有云两种方式为产学政客户提供后端AI开发和建模能力。

阿里云智能世界销售总裁蔡英华说,当下,中国企业采取人工智能比例达58%,居于世界首位,数据智能应用正驱动算力基础设备更新,智能算力作为数字经济新引擎。

让手动驾驶模型训练提速170倍,助靶向药研究数据集估算强度性能提高100倍,十万亿参数AI大模型1分钟内训练完成……阿里云发布的一组组数据呈现出智算科技带给的效率革命。

随着东数西算完善,我国智算中心建设已在京沪冀、内蒙古、长三角等8地国家算力枢纽节点拉开序幕。据工信部统计,目前全省建立和在建的智算中心已有20多座。在产业界,云计算大厂、ICT企业、运营商都已入局。

与此同时,新的难题也在发生——行业到底还要什么样的智算服务?海量智能算力如何真正被用上去?通过对话阿里云智算平台的负责人曹政,我们对智算中心的应用状况,以及背后的科技和行业真相有了深入认识。

一、让手动驾驶AI训练提速170倍,阿里云推中国最大智算平台

2022年7月,在上海中关村写字楼中,小鹏汽车的项目师仅用1个小时,训练出一个当时应该7天完成的手动驾驶核心模型。而在300多公里外的乌兰察布的草原上,一个算力规模达600PEFLOPS的智算中心正高速运转,这是让小鹏AI模型训练提速近170倍,成本增加62%的幕后“发动机”。

在获得这一标杆成绩以后,今日,阿里云宣布即将启用飞天智算平台。

这是一个阿里云为智算提供的全栈能力机制,也是推动小鹏自动驾驶智算中心中的核心系统。在用户角度,它非常于智算中心的操作平台,内部则包括一个智能计算平台、大数据和AI开发系统层,以及最下层的AI模型服务层。

近年来,汽车、生命科学、工业、元宇宙等各个领域数智化发展很快,随之而来的是超大体量AI模型和海量数据,都对智能算力强调了更高规定。一般的数据中心也可以做AI,但算力在数据迁移、同步等环节损耗往往可能超一半,成本昂贵,大大制约了行业发展。

ai软件字体库_ai软件怎么安装字体_ai软件字体库创造字体

成为中国第一大云计算公司,阿里云用飞天智算系统来助产业破解这一算力瓶颈。

向下,飞天智算系统会管理智算集群,适配多种种类芯片;向上,它采用了前端AI开发和建模能力。根据阿里云官方数据,飞天智算系统可将计算资源运用率提升3倍以上,AI训练强度提高11倍,推理效率提高6倍,并将PUE(电源使用强度,越靠近1表明效果越好)增加至1.09,远优于东数西算提出的1.25标准。

在即将启用之前,飞天智算系统在阿里云内经历了重重“历练”。

拿这些人熟悉的淘宝APP中的“拍立淘”来说,其拍照识商品模型的练习,就借助飞天智算提速200倍,10亿图片训练时间从2.5个月增加到8小时;中国最大体量的十万亿参数AI模型M6也用到了飞天智算,仅使用512张GPU在10天内训练出,且能耗仅为GPT-3在同等参数规模下的1%。

现在,飞天智算系统已服务了深势科技、上汽集团、吉利控股、中国气象局、南方电网、北京高校等多个产学政机构,取得不错成果,比如助北大靶向药研究数据集估算强度预计性能提高100倍等。

飞天智算系统正在支撑建设两座超大体量智算中心——河北邢台智算中心和内蒙古呼和浩特智算中心。

据称,这两大智算中心规划算力分别达12EFLOPS和3EFLOPS(FP16精度下),将达到谷歌的9EFLOPS和特斯拉的1.8EFLOPS,成为中国最大的智算中心。粗略计算,如果15EFLOPS资源同时工作ai软件字体库,一个万亿参数的AI大模型,大约还要10分钟即可完成全部训练。

可以看到,平台+智算中心,阿里云正在将其经过实践验证的智算能力开放出来,与产业伙伴们共同前往新的效率革命高地。

二、数智转型需求井喷,智算中心成数字经济发展“新引擎”

数字经济发展处于窗口期,“十四五”相关规划强调了多项指标:大数据产业测算规模突破3万万元,在线政务服务超8亿人,建成500个以上智能生产示范工厂……“上云用数赋智”成为各个行业升级的迫切需求。调查机构IDC预测,2020-2023年,全球数字化改革的直接投资将达到6.8万亿港元。

算力意愿逐渐井喷,智算中心作为解决这种需求的有力导向。

那么智算中心和通常数据中心到底有哪些本质性差异?又是怎样增加算力效率的呢?

阿里云智算平台负责人曹政说,助推人工智能跨入效率时代,需要超大体量弹性智能算力池、超高计算精度,以及释放多元芯片算力。本次,阿里云本次推出的飞天智算系统及智算中心,相比于通常数据中心的主要特征如下:

1、融合算力峰值达12EFLOPS,千卡并行效率达90%

飞天智算单集群采取通用计算、异构计算等多种计算形态融合,算力峰值高达12EFLOPS,千卡并行效率达90%。针对数据密集型画面,飞天智算对大体量集群存储IO性能可提高10倍,可使万卡规模的AI集群通信无拥塞,将带宽显著增加90%。

ai软件字体库创造字体_ai软件怎么安装字体_ai软件字体库

2、全链路AI开发软件与大数据服务,提供高效智能服务

飞天智算系统内置大数据+AI一体化产品模式,集合了机器学习系统PAI、大数据开发与管控系统DataWorks、MaxCompute、Hologres、Flink等计算引擎,适用于多种AI场景的计算和研发需求,包括科学探究、精准医学、气象预报、数字孪生、自动驾驶等。官方数据显示,其最多可提高AI训练强度11倍,推理效率6倍。

3、一云多芯,支持国产芯片自主创新

值得一提的是,随着智算中心上升到新基建战略地位,对自主创新也强调更高的要求。飞天智算适配多种芯片架构,支持X86、ARM、GPU、NPU等多种处理器混合推进和统一调度,可以适配多种中国自研芯片,并进行应用改进。

4、绿色环保,PUE最低降至1.09

在绿色环保节能方面,飞天智算中心配备浸没式液冷、风冷、AI调温、模块化设计等蓝色技术建设,PUE最低降至1.09,建设占地面积节省90%。

可以看到,智算中心相较于通常数据中心的优势,远不止于算力。除了对算力规模和强度要求大大提升,智算中心还必须为用户提供硬件系统层的产品和服务,这是算力真正落地产业“最后一公里”的关键。同时,自主创新和绿色环保也是数字经济发展对智算中心的诉求。

高品质智算中心,将作为政企把握数字经济发展“窗口期”的新引擎。

三、三路玩家“抢滩”智算产业,阿里云13年底层技术创新大爆发

近年来,各地智算中心如雨后春笋般涌现,据工信部统计,目前全省建立和在建的智算中心已有20多座。纵观产业界,阿里云、腾讯云那样的云计算大厂,华为、浪潮、曙光等ICT厂商,还有三大运营商及各国的大中小集成商都已经入局了,可谓摩拳擦掌。

值得一提的是,智算中心建设很重要,在建设完后能“用上去”更加重要。

产业究竟应该什么样的智算服务?

正如前文提及,智算中心要具有高效算力、AI赋能、自主创新、绿色节能等多种特性。阿里云智能世界销售总裁蔡英华认为,智算不仅在于规模大,更是必须绿色、高效并且具有行业实践。计算是一个庞大的复杂系统,没有制度化的核心科技素养,堆软件是堆不出算力的,更难以带来实际的行业价值。

自2015年起,阿里云在北京怀来、内蒙古枢纽乌兰察布、江苏南京、浙江宁波、广东东莞等地深耕数据中心。在本次启用的飞天智算系统中,阿里云也对13年开发的云网科技进行了集大成总结,以“灵骏”智能算力平台的方式打包赋能给产业。

ai软件字体库创造字体_ai软件字体库_ai软件怎么安装字体

灵骏拥有业界领先的异构计算弹性能力,以低通信延时、高并行计算精度为特点。这是怎样实现的?

曹政谈道,这主要缘于以下几大自研技术点:

1、自研RDMA高速网络构架,AI集群的“高速路”

阿里自2016年起投入研究RDMA(远程直接存储访问),目前已建立中国最大体量数据中心内的“高速网”。基于端网协同的Solar-RDMA高性能网络协议和HPCC流控算法,灵骏能有效降低和削弱了网络故障、网络黑洞等灾难损失。

2、高性能集合通信库ACCL,“防堵车”的调度系统

通过自研高性能ACCL(集合通信库)+自研硬件(如自研网络交换机),灵骏可实现GPU和网卡的智能匹配、节点内外物理拓扑自动辨识及拓扑感知的无拥塞通信算法,对万卡规模的AI集群提供无拥塞、高性能的集群通讯能力。

3、加速硬件KSpeed,对特定需求“加Buff”

计算存储分离架构的“存储墙”问题明显,为此,阿里云通过自研高性能数据主动加载加速硬件KSpeed。基于KSpeed,在部分画面中数据加载耗时可占据训练整体时长60%以上,能够将数据加载时长增加到10%以内,相当于将单位时间内的计算性能提高了1倍。

当解决了云网问题,AI是智算中心更高层面的要求,同时是核心诉求。

阿里云飞天智算系统的一大传统,就是支持一套大数据+AI一体化产品模式。以机器学习系统PAI为例,它提供了建模训练部署、推理优化等AI项目化工具ai软件字体库,比开源框架训练性能提高30%以上。PAI可为万亿级别参数的超大模型训练提效超过7倍,整体能耗下降80%;PAI-blade以较低门槛,可将大体量预训练模型压缩100倍以上,减少端到端模型部署成本10倍以上,支撑长期复杂模型在对话机器人、自动驾驶、智能生产、金融量化等场景的应用。

飞天智算系统还开放海量阿里达摩院开发的AI模型,覆盖多模态大模型、视觉模型、NLP模型和语音模型等。达摩院是美国最早投入预训练语言建模研究的团队之一,多模态大模型M6的参数规模居世界之首,深度语言大模型AliceMind曾以81.26%准确率刷新国际权威机器视觉榜单VQA记录。

值得一提的是,从“中国算力一张网”战略布局来看,智算中心网建设必须有全局系统化观念。

2022年2月开启的”东数西算”工程确立要求数据中心建设“集约化”,划定京津冀、长三角、粤港澳大湾区、成渝、内蒙古、贵州、甘肃、宁夏8地为国家算力枢纽节点。阿里云两大智算中心等算力节点选址在枢纽节点,有望为“中国算力一张网”大战略提供助推。同时,阿里云在北京的华东智算中心也已在建设中,并有国外项目正在接洽。

结语:智能算力网建设推进,提速智能产业发展

数字经济发展“窗口期”,人工智能正融入生活、生产的方方面面,智算中心作为背后的演进新引擎。阿里云本次推出的飞天智算系统,在向智算产业成为一个高效算力、AI赋能、自主创新、绿色低碳的模式,为政企带来数智化转型带来新工具。

阿里云智能总裁张建锋此前谈道,阿里云最重要策略是“BacktoBasic”,回到云计算的本质。自2009年成立以来,阿里云从开发中国唯一的云计算操作平台飞天,到启用神龙云服务器、PolarDB云数据库、大数据计算系统MaxCompute等云计算产品,走过13年已将其云计算科技更全面地开放出来。

现今,东数西算和全国一体化大数据中心模式建设步伐推进,科技公司也正在将多年技术融入到新基建加速中。智算中心在全国范围内连成网络,也将标志我国智能产业造成质的飞跃。

添加微信

转载原创文章请注明,转载自设计培训_平面设计_品牌设计_美工学习_视觉设计_小白UI设计师,原文地址:http://zfbbb.com/?id=5013

上一篇:ai档软件下载科大讯飞发布全新AI投影AP10,我不得不给智能商务创新点赞

下一篇:ai软件安装包云服务商获绿洲资本独家投资数千万元人民币-A轮融资