英特尔升级多显卡 AI 推理,Battlematrix 整体性能最高提升 80%

时间:2025-08-14 10:52:59

新闻速递:英特尔锐炫Pro显卡迎重大升级,科技媒体WccfTech发布了一份值得关注的博文,报道了英特尔对其高端GPU系列锐炫Pro的新进展。该更新名为LLM Scaler v专注于优化AI推理能力,标志着这一项目迎来重要里程碑。这项软件更新旨在提升图形处理性能和加速人工智能应用,进一步推动游戏、专业渲染和数据中心领域的技术发展。

英特尔于 年 月在台北国际电脑展上展示了其锐炫 Arc Pro系列显卡以及Project Battlematrix推理工作站平台。这款平台支持最多八张锐炫Pro显卡,具备软件包支持,能够运行高达参数的中等规模且精度高的AI模型。

Battlematrix平台集成硬件与定制化软件栈,优化推理性能和企业部署体验;而LaaScaler是基于vLLM框架开发的AI大模型推理容器,支持多GPU扩展、长序列高效推理及多模态任务。

LLM Scaler v版本重点优化了 vLLM 推理框架,在 KPI 模型下, 序列长度性能提升高达 倍; KPI 模型的性能提升则达到惊人的 倍。此外,对于规模在 到 的模型,输出吞吐量相比之前的版本也提升了约 。

全新升级的版本采用了多层次的在线量化机制,显著减少了内存使用,支持并行处理、跨模态模型融合以及有序排列,增强了模型的灵活性和可扩展能力。

为便于企业级运维,LLM Scaler v1.0 集成了 XPU Manager 工具,支持 GPU 电源管理、固件升级、诊断及显存带宽检测。

新一代容器技术采用Linux架构,有效利用多GPU扩展和PCIe点对点传输,显著提高整体性能达到以上,同时还拥有ECC纠错码、SRIOV网络、遥测监控及远程固件更新等功能,适用于企业级应用场景。

英特尔宣布推出采用行业标准的新软件栈,并兼容主流开发流程,OneCCL基准测试工具的有效整合为开发者优化程序性能及评估性能提供便利,从而增强Battlematrix平台生态系统的支持。

根据英特尔路线图,在本季度内,还将发布更为稳固的容器版本,并进一步优化 vLLM 服务能力。预计到今年第四季度,Battlematrix 项目将实现全功能版本落地,推动大模型推理平台的持续升级,为专业领域用户提供更高效、易用的 AI 解决方案。

相关下载

相关资讯

猜你喜欢

最新资讯

相关合集