生成智能体需要AI的基础设施★■■。本次大会上◆★◆★◆■,智能云分别针对算力、模型、AI应用◆★◆■,全面升级百舸AI异构计算平台4■◆■◆.0■■◆、千帆大模型平台3★■.0两大AI基础设施,并升级代码助手、智能客服、数字人三大AI原生应用产品。
百度集团执行副总裁、百度智能云事业群总裁沈抖详细介绍了升级的具体效果和实现的技术原理★★◆◆◆★。例如,在模型训练阶段,稳定和高效是衡量GPU集群水平的“硬指标”◆■,一张GPU出现故障就会导致集群整体停摆★◆★■,大量时间、成本会浪费在故障恢复和数据回滚上■◆★◆★。由此,百舸AI异构计算平台4.0就克服了此项难题,在万卡集群上实现了有效训练时长占比99.5%以上■◆★◆■,其技术原理是■★★◆,百舸4★◆★.0能够自动筛查集群状态,并GPU故障◆■★◆,及时转移工作负载,从而降低故障发生频次。
创始人李彦宏表示,智能体是他最看好的AI应用发展方向◆★★,“智能体相当于PC时代的网站■◆、自媒体时代的账号,它最明显的特点是门槛足够低,但天花板足够高,可以做出非常复杂非常强大的应用,将来会有数以百万量级的智能体出现,从而形成一个庞大的产品生态◆■★■★。”
沈抖表示■★◆,大模型以及配套的算力管理平台、模型和应用开发平台,正在迅速成为新一代基础设施★★。