博客

HPC

助某科技公司 “X86+ARM” 融合集群,解锁 3D 建模新范式

2026.02.12 14分钟阅读

在科技浪潮汹涌澎湃的当下,算力已成为推动各行业创新发展的核心驱动力。今天,就带大家走进某科技公司,一同探寻他们在算力升级领域的精彩实践,看看如何为 3D 建模业务注入强大动力!

项目背景
科研深耕,算力升级势在必行

某科技公司作为行业内的高科技先锋,始终将科研发展置于重要地位。公司目前聚焦于 3D 建模相关业务,围绕 3D 模型的构建、渲染、优化等环节展开深入分析计算。

为满足业务需求,公司已搭建多套高性能计算设备及高性能存储设备,核心架构为 X86,并采用集群管理软件 LtAIDC 进行整体资源管理和集群整合。然而,随着科研需求不断攀升和业务持续拓展,对更高性能国产算力设备的需求愈发迫切。本次项目旨在基于原有集群平台扩展国产算力设备,支持主流大模型的推理部署、前端模型微调和算法优化,为前端 3D 建模业务全面赋能。

 

项目需求
补齐短板,构建混合架构集群

公司现有的 X86 架构集群已形成稳定的算力支撑,该集群包含 1 台管理节点、4 台 8 卡 NVIDIA GPU 计算节点,以及由 3 个存储节点构成、可用容量达 400TB 的分布式存储系统,主要服务于 3D 建模相关业务的 AI 训练任务。

但随着科研任务对国产算力需求的提升,以及大模型部署场景的拓展,现有集群在国产算力补充与架构兼容性上存在明显短板。因此,本次项目核心需求是在原有 X86 集群基础上,新增两台国产信创算力节点,节点搭载 8 卡 910b4 芯片。同时,需确保新增 ARM 架构节点与原有 X86 集群实现深度融合,涵盖算力资源调度、存储系统对接等方面,形成“X86 + ARM”协同的混合架构集群,满足多样化的科研计算需求与国产算力布局要求。

 

痛点分析
架构融合与使用门槛成两大挑战

在本次集群扩展项目中,公司面临着两大核心痛点:

架构融合难题
公司团队长期基于 X86 架构集群开展科研工作,对新增的 ARM 架构算力节点技术特性、操作逻辑、性能调优方式了解相对较少,相关技术储备与运维经验不足。这导致 ARM 节点使用门槛较高,可能影响科研任务的高效推进。

兼容性顾虑
公司对“X86 + ARM”混合架构的兼容性存在担忧,害怕新增 ARM 节点无法与原有 X86 集群的计算资源、调度系统、存储设备实现顺畅协同。若出现资源孤岛或调度断层,不仅会浪费新增算力资源,还可能干扰现有 3D 建模科研业务的稳定性,难以充分发挥混合架构的算力优势。

 

解决方案
硬件扩展与软件整合双管齐下

针对公司需求与痛点,本次项目从硬件扩展与软件整合两方面构建解决方案:

硬件层面
严格按照需求新增两台国产信创算力节点,核心 NPU 均采用 8 卡 910b4 配置,确保国产算力充足补充。同时,重点完成新增节点与原有分布式存储系统的对接,通过协议适配与链路调试,实现 ARM 节点对 400TB 存储资源的高效读写访问,避免存储资源孤岛问题。

软件与管理层面
采用联泰 LtAIDC 集群管理软件作为核心调度平台,依托其成熟的异构资源管理 GPU 透传分布式训练能力、分布式训练调度等功能),将原有 X86 集群与新增 ARM 计算节点纳入统一管理体系,实现算力资源的统一监控、调度与分配,打破架构壁垒,确保“X86 + ARM”混合集群的协同运行,有效降低多架构管理复杂度。

项目具体配置如下:

管理节点:用户原有双路 Intel CPU 服务器 1 台;
X86 计算节点:用户原有 A6000 服务器 3 台;
信创计算节点:新增 910b4 节点服务器 2 台;
分布式存储节点:用户原有 400TB 可用容量分布式存储1套;
网络部分:原有 24 端口千兆交换机 1 台,36 端口 100GbE IB 交换机 1 台;新增 200GbE RoCE 交换机一台;
集群管理:LtAIDC 异构资源管理平台。

整体方案架构

 

用户收益
多维度提升,助力3D建模业务腾飞

本次“X86 + ARM”融合集群项目的落地,为公司带来了多维度核心收益:

管理效率显著提升
通过 LtAIDC 软件将 X86 与 ARM 架构节点整合为单一管理视图,公司无需切换多套管理系统,即可完成算力调度、任务部署与状态监控,操作流程更便捷,管理效率大幅提升。

算力支撑充足有力
新增算力节点性能满足高端科研需求,搭载 8 卡 910B4 NPU 的信创节点,可稳定支持 DeepSeek 671B 等大模型的部署与运行,为公司开展更大规模的 3D 建模分析、优化算法等科研任务提供充足算力支撑,助力科研能力升级。

系统安全可靠有保障
LtAIDC 软件的资源隔离、故障监控功能,结合原有分布式存储的冗余机制,确保混合集群运行过程中的数据安全与业务连续性,降低系统故障风险。

该科技公司的“X86 + ARM”融合集群项目,为 3D 建模业务的发展开辟了新的道路。未来,相信公司将继续凭借科技力量,在 3D 建模领域创造更多辉煌!

相关贴子

敬请登记。

登记
本网站受 reCAPTCHA 保护,适用 Google隐私政策和服务条款。