联系我们
发送留言
二维码

TOP

返回顶部
合作咨询
  • 姓名

  • 邮件

  • 手机号码

  • 公司名

  • 联系留言

联系我们
  • 总部地址

    广州市黄埔区瑞吉二街京广协同创新中心45号楼6-9层

  • 电子邮箱

    trusme@trusme.com.cn

  • 联系电话

    400-855-2725 / 020-38638003

  • 传真号码

    020-38637770

当前位置  :   新闻中心  >   公司新闻  >   推理无界 x 内核重塑 | 信维Nous AI服务器全新发布    

推理无界 x 内核重塑 | 信维Nous AI服务器全新发布

发布时间 : 2025-12-18 07:51:48
已被浏览 48 次

人工智能技术飞速发展,大模型推理应用全面普及,行业竞争已迈入多维度比拼新阶段不仅聚焦代码处理、超长文本解析与智能体自主任务完成能力,更向着语音、图像、视频的秒级处理与实时融合突破,这使得大模型推理对AI算力的要求达到新高度。

当前,高性能算力卡售价飙升且供不应求,不少用户转而选择游戏卡用于模型训练与推理。为支撑模型推理、视频解码、离线渲染等多元应用,市面上4U8 卡紧凑型算力方案成为主流,但实际应用中痛点凸显:游戏卡尺寸规格不一,导致4U机箱常无法同时容纳8张算力卡,算力资源难以充分释放;加之下一代 GPU功耗与发热量大幅提升,对机箱空间、散热效率及供电稳定性提出了更严苛的要求。

面对指数级增长的推理算力需求,如何精准匹配业务场景与计算任务,选择最优算力方案,让每一分预算都转化为高效算力,成为行业共同关注的核心问题。

基于对业务应用痛点的深度洞悉,也得益于灵活而强大的产品设计开发能力,信维智算正式推出全新Nous系列服务器,作为信维AI服务器的新成员,No us-HP61 6U服务器以领先的硬件设计与灵活的拓扑方案,助力企业实现千亿级参数模型的推理与部署,推动AI应用规模化落地。

信维Nous系列服务器具备卓越的多元算力性能和极致弹性的架构扩展能力,是一款面向新一代人工智能应用的全新服务器。

No us服务器外观为6U机架式结构,基于Intel第四/五代鹰溪平台,支持多达8张600W双宽GPU,满足千亿级参数大模型推理需求,支持多CPU-GPU以及GPU-GPU互联拓扑,满足各种AI业务场景下的应用需求。

  • 搭载双路第4代或第5代英特尔至强可扩展处理器(最高TDP 350W);

  • 提供16个内存通道,最多可配置32条DDR5内存,最大频率5600MHz,内存带宽提升75%;支持内存镜像、内存热备、内存故障隔离等多种保护模式;

  • 最大可支持10张双宽 GPU卡如:RTX 50系列显卡和RTX PRO 6000系列显卡,有效满足用于云游戏、人工智能、云计算、大数据分析等场景;

  • PCIe 直通配置低时延打造极致性能;

  • 最多支持11个PCIe标准插槽(含1个OCP插槽),可根据需求选择多种 PCIe 配置。支持8+2个SATA/特种空军团/NVMe三模硬盘配置,满足高速传输与数据存储需求;

  • 多种网卡选配方案,支持扩展智能网卡,满足对高效网络传输的要求;

  • 电源支持N+N冗余,保障业务连续性与系统稳定运行,适配AI推理、云计算等7X24H高负载场景;

  • 6U机架式设计,适配高功耗新一代GPU无压力,散热优确保系统稳定;

  • BMC支持依据环境温度与GPU负载动态调节风扇转速,在确保GPU稳定运行的同时,有效降低整机功耗与TCO

  • 中置风扇双端子设计,风量增加30%,上下隔离,分区散热,提升散热效率;

  • 提供关键部件的健康状态监控和上报功能,实现产品全生命周期的智能服务;

  • 通过免工具抽屉式计算模块和热插拔硬盘设计,大大简化运维过程;

其他新闻