亿丰集团

新闻中心

新闻资讯更多>>

新闻中心您当前所在位置：首页 > 新闻中心 > 面向AI大模型的智算集群及网络的实践和展望

面向AI大模型的智算集群及网络的实践和展望

一“算力是人工智能发展的重要驱动力，影响着大模型的迭代和创新的速度，也影响着经济发展的速度。”在智算方面，中国电信重点推进两项工作，一是建成大规模智算集群，目前上海、北京两个万卡集群已经投产。面向AI大模型训练的智算集群，需要从IDC向AIDC升级，重点围绕模型算力利用率MFU、线性加速比、稳定性、时延、丢包率、GPU利用率等六大关键指标，持续开展智算集群的设计、建设、运营、优化等工作，提高大模型训练的效率效能。

二是用智算网络和算力调度平台实现全国算力资源的互联互通，按需调用，自研“息壤”算力调度平台，已实现全国21EFlops的算力调度。中国电信积极探索“云、网、智”的融合技术，致力于打造弹性超宽、高速无损、“云、边、端”全域调度的智能算力网络，满足不同企业、不同行业对大模型训练和推理的差异化需求。

中国电信已经从电信运营商升级到电信+云计算的运营商。在AI时代，中国电信还将升级为智算服务商和大模型服务商，提供算力服务和模型服务。

算力的网络化成为发展方向，并倡议：一是推动算力生态的开源开放，为异构算力互通提供基础的开发环境，以统一标准对接各类异构硬件，方便大模型在异构算力间自由切换。二是推进共建共享。生成式人工智能是重大的科技创新和产业变革，需要早布局、快推进，需要学术界和产业界以战略眼光强化合作，集中力量突破底层技术，推动产业创新和产业生态建设。