新浪娱乐2024年10月11日发布:中国工程院院士郑纬民:做好十个软件,改善基于国产AI芯片的系统生态

⭐发布日期:2024年10月11日 | 来源:新浪娱乐

⭐作者:甲丁 责任编辑:Admin

⭐阅读量:458 评论:4人

【天天六开彩澳门资料大全】

【澳门天天开马结果出来】

【打开澳门网站资料大全】 【免费全年资料大全正版】 【澳门精准王中王免费资料中】 【澳门管家婆一肖一码一特】 【新澳门精准三肖三码中特】 【新澳门2024年资料大全管家婆】 【澳门正版资料免费大全新闻最新大神】 【管家一肖一码资料大全】
【新澳天天资料大全】 【新澳高手论坛资料大全最新】 【新奥天天免费资料东方心经】 【4949澳门正版免费资料全解】 【王中王论坛免费资料大全】 【香港二四六开彩资料大全302期】 【澳门三肖三码精准100%】 【2024全年資料免費大全優勢】

每经记者:杨卉 每经编辑:杨夏

4月28日,中国移动2024算力网络大会在苏州开幕。《每日经济新闻》记者在现场注意到,会上,中国工程院院士郑纬民提到,目前有三类系统可支持大模型训练。

其中,基于英伟达GPU的系统一卡难求;基于国产AI芯片的系统仍面临国产卡应用不足、生态系统有待改善的问题,可通过十个软件来进行改善;基于超级计算机的系统,可在做好软硬件协同设计的情况下实现大模型训练,但需在超算机器尚未饱和的前提下操作。整体来看,尽管打造国产A1卡的万卡大模型训练平台难度不小,但十分必要。

图片来源:每经记者 杨卉 摄

国产卡应用不足,生态系统有待改善

郑纬民提出,近两年来人工智能的发展导致算力需求呈爆发性增长,其中模型研发需要配套算力;模型训练需要海量算力,如训练GPT-4需要一万块英伟达A100芯片跑上11个月;模型精调需要可控算力;模型推理需要可靠算力,算力存在于大模型生命周期的每一环。

然而,海量算力背后有一个很现实的问题:贵。根据郑纬民计算,在大模型训练的过程中,70%的开销要花在算力上;推理过程中95%的花费也是在算力上,人工智能产业算力成本居高不下。

郑纬民进一步指出,要构建基于国产AI卡的万卡大模型训练平台,需要考虑到几个问题。首先是半精度运算性能与双精度运算性能的平衡问题。郑纬民强调,在设计过程中,不仅要考虑半精度运算性能,还要考虑双精度运算能力,双精度与半精度运算性能之比为1∶50—1∶100为宜。“不论是自己做还是买,第一件事情就是问比例是多少。”

第二点是网络平衡设计。

郑纬民解释称,万卡系统中的万块卡不能分散在各地,将其连接起来就是所谓的网络。但连接也很有“讲究”,每块卡之间能实现直连是最好的状态。但如此一来,每块AI卡都需插上9999块连接卡,一万块AI芯片均要实现直连,所需的连接卡数量太过庞大,成本甚至还要高过万块卡本身。此外,即便资金充足,卡槽数量也无法满足需求。因此,网络设计不能只针对CNN算法,还需考虑极大规模预训练模型对系统的需求。大规模预训练模型需要高带宽低延迟网络,支持数据并行,模型并行和专家平行模式。

第三点是体系结构感知的内存平衡设计。郑纬民强调,一方面访问内存的请求使网络拥塞,降低吞吐量,反映到应用程序上表现为访存性能显著下降;另一方面,多个访问内存的请求可能访问同一存控对应的内存空间,负载不均,存控需要顺序处理访存请求。

第四点是IO子系统平衡设计。郑纬民进一步解释称,万卡系统中负载的芯片数量太大,即便是英伟达芯片,也基本会在三小时左右出现一次错误。过去,为保证训练不被中断,大模型训练厂商通常采用间隔一段时间,如2.5小时对数据进行一次保存或转移,一旦出现错误可以不必从0开始,可在保存位置继续执行。

然而,大模型训练数量过大,很难沿用上述操作模式。因此,万卡系统除了支持检查点操作,还需增加SSD(固态硬盘)。另外,系统的本地NVMe SSD仅通过本地文件系统访问,限制了其应用范围,需将每台服务器上的快速本地NVMe整合为应用可见的全局分布式文件系统。

郑纬民分析指出,目前来看,支持大模型训练有三类系统,分别为基于英伟达GPU的系统、基于国产AI芯片的系统和基于超级计算机的系统。其中,基于英伟达公司GPU的系统硬件性能和编程生态好,但受到禁售影响,加之价格暴涨,一卡难求。而基于国产AI芯片的系统,尽管近年来国内二十余家芯片公司取得了很大的进步,但仍面临国产卡应用不足、生态系统有待改善的问题。

十大软件改善基于国产AI芯片的系统生态

郑纬民直言,要改善基于国产AI芯片的系统生态,这一问题其实并不“抽象”,需要做好十个软件。

第一是编程框架应进一步降低编写人工智能模型的复杂度;利用基本算子快速构建人工智能模型,如PyTorch、TensorFlow。

第二是并行加速,为多机多卡环境提供人工智能模型并行训练的能力;支持数据并行、模型并行、流水线并行、张量并行等,如微软的DeepSpeed、英伟达Megatron-LM。

第三是通信库要提供跨机跨卡的通信能力;可支持人工智能模型训练所需各种通信模式;可根据底层网络特点充分利用网络通信带宽,如英伟达的NCCL库、超算普遍支持的MPI通信库。

第四是算子库,需提供人工智能模型所需基本操作的高性能实现;能够尽可能覆盖典型人工智能模型所需的操作;算子库能充分发挥底层硬件的性能,如英伟达cuDNN,cnBLAS。

第五是AI编译器,要可在异构处理器上对人工智能程序生成高效的目标代码;对算子库不能提供的操作通过AI编译器自动生成高效目标代码,如XLA、TVM。不过,郑纬民也谈到,目前国内掌握AI编译器的人才较少,实现难度较大。

第六是编程语言,要提供异构处理器上编写并行程序的支持;覆盖底层硬件功能,发挥硬件性能;能够编写人工智能模型的基本算子(Operator),如英伟达的CUDA,Intel的oneAPI。

第七是调度器,需具备在大规模系统上高效调度人工智能任务的能力;同时设计高效调度算法,提高集群资源利用率,如Kubernetes(K8S)、华为ModelArts。

第八是内存分配系统,可针对人工智能应用特点提供高效的内存分配策略。

第九是容错系统,用来提供在硬件发生故障后快速恢复模型训练的能力。

第十是存储系统,需支持训练过程中高效的数据读写(检查点训练数据等)。

郑纬民直言,当前国内已经有了上述软件,但做得不够全,不够好。当务之急是先将上述软件做好,从而提高用户的使用意愿。郑纬民强调,国产AI芯片与业界领先水平存在一定差距,但若将生态做好,只要性能可以达到业界领先水平的一半或60%,客户也会愿意使用,大多数任务不会因芯片性能的微小差异而有明显感知。

至于第三种渠道,基于超级计算机的系统,根据郑纬民透露,当前国内约有14个国家级超算中心,性能很快且机器使用情况尚未达到饱和。若软硬件协同的设计做好,在超算机器上做大模型训练也是可能实现的。

郑纬民提供的视频演示显示,在某国产超算上进行大模型训练与推理时,使用超算调度系统申请512个节点来进行7B模型预训练,半精度和全精度训练效果可与英伟达平台完全对齐;与租用英伟达GPU相比,使用国产超算可节省6倍左右的成本。加载开源的百川2—7B模型进行推理,推理精度也与英伟达一致。更为关键的是,从成本角度考虑,在上述超算平台上训练大模型,只需花费英伟达系统六分之一的成本。

谈及当前智能算力行业面临的痛点,郑纬民直言,构建国产万卡系统很难,但很有必要,未来还是要繁荣国产卡的生态系统,做好软硬件的协同设计,同时解决大模型基础设施的几大问题。“虽然很难,但只要我们努力,与芯片公司合作,一定能将万卡系统做好。”郑纬民称。

每日经济新闻

【王中王免费资料大全料】 【今晚必中一码一肖澳门】
【新澳门六开彩正版免费资料大全】 【澳门最精准正最精准龙门】
【今晚澳门特马开什么今晚四不像】 【494949结果最快】
【2024港彩结果历史查询】 【2024澳门管家婆资料正版大全】
【新澳门资料大全免费澳门资料大全】 【二四六天天免费资料门图讯最快开】
【澳门一肖一码一必中一肖雷锋】 【新澳门免费资料大全新牌门】 【奥门一肖一码免费知资料】
上一条新闻 下一条新闻

推荐文章

发表评论

刘汉

9秒前:十大软件改善基于国产AI芯片的系统生态

IP:14.82.5.*

康飞

3秒前:”郑纬民称。

IP:51.26.6.*

Stan

5秒前:郑纬民进一步指出,要构建基于国产AI卡的万卡大模型训练平台,需要考虑到几个问题。

IP:76.25.8.*

新浪娱乐APP介绍

APP图标

澳门六开彩资料查询最新2024APP名:新浪娱乐

版本:V8.41.712

更新时间:2024-10-10 17:17

新澳门王中王资科公开这是一个功能强大的澳门管家婆-肖一码APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:第四是算子库,需提供人工智能模型所需基本操作的高性能实现;能够尽可能覆盖典型人工智能模型所需的操作;算子库能充分发挥底层硬件的性能,如英伟达cuDNN,cnBLAS。

黄大仙100%最准一肖一码APP介绍

APP图标

澳门天天开彩好2024免费资料APP名:新浪娱乐

版本:V4.93.649

更新时间:2024-10-10 20:18

无论是澳门平特一肖100%准资特色快速浏览新闻还是深入了解某个话题,这款新闻APP都能为您提供全面、精准的信息服务。

管家婆精准资料免费大全下载APP介绍

APP图标

请把澳门特马的资料发过来看一下APP名:新浪娱乐

版本:V7.91.927

更新时间:2024-10-10 24:19

澳门必中三肖三码网站o应用界面简洁易用,用户可以轻松浏览头条新闻、深度报道和特写文章。24小时内的热点资讯一目了然,让您随时掌握世界动态。此外,您还可以参与评论,与其他读者交流看法,形成一个互动活跃的社区。

澳门六免费资料网站大全APP介绍

APP图标

今晚澳门码特开什么号码APP名:新浪娱乐

版本:V4.31.740

更新时间:2024-10-10 24:13

澳门最快最精准的资料这款新闻APP是您获取实时信息的理想伴侣。它汇聚了全球最新的新闻报道,涵盖政治、经济、科技、娱乐、体育等多个领域。通过个性化推荐功能,您可以根据兴趣定制新闻源,确保每条信息都与您相关。

澳门最牛三肖三码中特的优势APP介绍

APP图标

2024年新跑狗图最新版APP名:新浪娱乐

版本:V5.64.584

更新时间:2024-10-10 21:14

这是一款功能强大的马会传真,澳门免费资料使用方法应用,专为帮助您高效完成各种任务而设计。它不仅提供最新的24小时热点资讯,还为您带来今日的最新动态:图片来源:每经记者 杨卉 摄 。无论是获取信息还是提升效率,这款APP都是您理想的助手。

澳门最准内部资料u7APP介绍

APP图标

澳门今晚开特马四不像图APP名:新浪娱乐

版本:V2.73.246

更新时间:2024-10-10 17:16

这是一款功能强大的2024年香港正版资料免费大全应用,旨在帮助您高效完成各类任务。它提供最新的24小时热点资讯,让您随时了解发生的重大事件。今天的最新内容包括:第八是内存分配系统,可针对人工智能应用特点提供高效的内存分配策略。,为您的生活和决策提供了重要参考。这款APP是您获取信息和完成任务的得力助手。

澳门结果记录表62期APP介绍

APP图标

2024年澳门王中王APP名:新浪娱乐

版本:V5.10.801

更新时间:2024-10-10 15:13

这是一款功能强大的新奥资料免费精准网址是多少?应用,专为帮助您高效完成各种任务而设计。它汇集了最新的24小时热点资讯,让您时刻掌握世界动态。今日的最新内容包括:而基于国产AI芯片的系统,尽管近年来国内二十余家芯片公司取得了很大的进步,但仍面临国产卡应用不足、生态系统有待改善的问题。,为您的决策和日常生活提供有价值的信息支持。无论您需要了解什么,这款APP都能成为您不可或缺的助手。

新澳姿料大全正版2024APP介绍

APP图标

澳门六结果2024记录查询网站APP名:新浪娱乐

版本:V7.88.392

更新时间:2024-10-10 17:18

今天的最新动态包括:整体来看,尽管打造国产A1卡的万卡大模型训练平台难度不小,但十分必要。,让您第一时间掌握关键资讯,做出明智的决策。这个应用不仅是您的信息获取工具,更是一个提升生活质量的得力助手。

澳门944c资料免费大全二四六APP介绍

APP图标

二四六天下彩天天免费大全APP名:新浪娱乐

版本:V5.43.595

更新时间:2024-10-10 19:22

这是一款功能强大的香港资料免费长期公开应用,能够帮助你高效地完成多种任务。它包括最新的24小时热点资讯,以及今天的最新动态:郑纬民分析指出,目前来看,支持大模型训练有三类系统,分别为基于英伟达GPU的系统、基于国产AI芯片的系统和基于超级计算机的系统。。

新澳门今晚开特马APP介绍

APP图标

澳门一肖一码100准确测算平台APP名:新浪娱乐

版本:V9.80.742

更新时间:2024-10-10 14:15

这款功能强大的2024年澳门王中王100%的资料应用旨在提升您的日常效率,帮助您轻松应对各种任务。应用界面友好直观,用户可以快速导航,获取所需信息。它不仅提供最新的24小时热点资讯,还定期更新各种主题的文章和评论,确保您始终走在信息的前沿。

49494949最快结果APP介绍

APP图标

澳彩天天开彩近期记录APP名:新浪娱乐

版本:V5.10.539

更新时间:2024-10-10 14:22

这款新闻APP是您获取实时新闻的最佳选择。它整合了全球各大新闻来源,提供最新的头条、热点和专题报道,涵盖从政治到娱乐的各个领域。用户可以根据兴趣自定义新闻推送,确保获取最相关的信息。

六开彩澳门结果查询APP介绍

APP图标

打开澳门六开彩免费APP名:新浪娱乐

版本:V1.91.870

更新时间:2024-10-10 20:20

APP界面友好,支持快速浏览和离线阅读。您还可以通过搜索功能,快速找到特定主题的新闻。互动功能让您可以评论、分享文章,与朋友讨论热点话题。无论您是在通勤、休闲,还是工作间隙,这款APP都能让您轻松掌握最新动态。