助力垂直行业轻量化模型应用落地 信维自研AI服务器来破局
发布时间 : 2023-09-07 11:41:12
已被浏览 229 次
近日携程发布了国内首个旅游行业垂直模型“携程问道”,面对“适合孩子玩的景点、适合家庭入住的酒店推荐”之类的问题,以后不用花时间搜索或查阅攻略,打开“携程问道”跟机器人聊上几句,或许就能获得一份适合自己的旅游推荐。

站在ChatGPT的行业风口,除了超大模型的演进发展,“专小深”的行业垂直模型异军突起,其深入行业深耕场景开发,打造行业垂直领域的轻量化模型。相比于通用大模型,技术难度降低且有效提升信息的准确性和可靠性,定制应用场景专属模型,赋能各行各业,解决行业的特殊需求,帮助企业降本增效将是必然趋势。
行业垂直模型的优势在于:一、解决专业领域问题;二、训练和部署成本更低;三、升级和迭代更灵活。行业模型的核心同样离不开算力、算法和数据,其产业落地更需要“智能新基建”,作为专注于人工智能领域的信维股份,面对垂直行业模型带来的庞大算力需求,信维定制了混合算力解决方案,实现AI计算的全场景覆盖。
作为信维完全自主研发的AI服务器,信维H5880G4在CPU和GPU的规格上做了合理调整,具备卓越性能、算存一体、性价比高等优势,可应用于深度学习模型训练、深度学习推理等AI应用场景,灵活匹配训推算力需求。H5880G4采用第三代英特尔® 至强® 可扩展处理器系列或可选第四代AMD EPYC处理器,4U空间支持8张NVIDIA RTX4090(涡轮版)做并行计算,24GB GDDR6X显存,16384 CUDA核心;前后空间充足,无结构干涉,显卡采用尾部供电设计,也不需要额外选购凸起顶盖。支持PCIe 4.0,通过 PCIe 扩展最多可支持8张4090 GPU卡,整机提供高达664 TFLOPS混合算力,加快AI模型训练效率,助力智能时代。
目前,H5880G4服务器已经在教育、算力租赁等多个垂直行业落地并成功应用,为用户“降本增效”的需求实现了更高的GPU利用率与更低的应用成本。

