本项目采用“5+2”异构算力集群架构:
计算侧——5台紫光最新一代高性能服务器,凭借高主频多核CPU与多卡并行GPU的协同设计,形成强劲的混合精度算力池,可充分释放大模型分布式训练潜能;
管理侧——2台华三旗舰级双路服务器,专职负责调度编排、镜像仓库、监控日志等控制面任务,保障平台7×24小时无中断稳定运行。
网络层全部选用华三企业级交换机,构建三张逻辑平面:
计算平面:100G全互联链路,实现参数面微秒级延迟,显著压缩分布式训练梯度同步时间;
业务平面:40G上行冗余链路,面向师生并发推理请求,可平稳承载多路大模型同时调用;
管理平面:25G独立通道,用于模型热更新、数据集高速注入及全局策略下发,零丢包保障平台持续迭代。
整套硬件栈为通义大模型提供“GPU-网卡-交换机”端到端无阻塞高速通路,充分满足高校未来科研与教学场景的弹性扩容需求。