爆款使用背面的商汤大设备

2025-07-04 11:31:17 

50%本钱节约 、爆款背面3~5倍推理时延下降 、使用设备100%的爆款背面QPS(每秒请求数)提高 !

由主意流打造的使用设备“造梦次元” ,是爆款背面由多模态。AI 。使用设备驱动的爆款背面新一代内容渠道 ,得益于商汤大设备AIGC解决方案从算力到模型的使用设备端到端支撑,经过算力和模型、爆款背面模型和运用之间的使用设备严密协同,既发明了最佳的爆款背面用户体会 ,又获得了最大化的使用设备本钱效益 ,现在已成为一款日均活泼互动时刻超越100分钟的爆款背面现象级运用 。

主意流合伙人 、使用设备Studio负责人张鸿表明 :“商汤大设备展现出三重中心优势:一是爆款背面算力与模型的深度协同 ,完成最高效的资源运用;二是针对文本  、语音 、图画等不同模态的协同 ,构建了流通天然的交互体会;三是支撑开源模型的完善生态 ,供给了多样化模型挑选  。这种多维度协同优势助力咱们完成了‘算力 、模型 、运用’三位一体的全链条优化 ,推进技能效能向商业价值的高效转化。” 。

日均6000万次调用、千亿token耗费 ,带来三大「生计应战」 。

依据对用户需求的洞悉 ,主意流经过技能创新直击AI互动运用普遍存在的“沉溺感缺乏”和“门槛过高”两大中心问题 。

例如 ,经过供给文字 、语音 、文图结合的多模态交互 ,让用户与AI的互动体会趋近实在人际沟通。此外 ,主意流还供给丰厚的创造东西,用户只需套用相关模板,就可快速建立完好互动内容 ,有用下降了创造门槛。

造梦次元每日均匀模型调用量高达6000多万次 ,一天耗费的token达千亿等级 。在如此巨大的规划下 ,任何卡顿 、宕机 、犯错都会导致严峻的用户丢失;任何因模型才能缺乏形成的体会欠安 ,都会影响产品口碑;任何细小的资源搁置  ,都会累计成巨大的本钱开支。摆在主意流面前的“生计应战”,首要体现在三个层面 :

2倍峰谷差的算力弹性战:造梦次元的渠道流量有着明显的潮汐特征,周末和节假日顶峰时段的流量可达低谷时期2倍 ,对基础设施算力资源有很强的弹性弹性需求。

推理时延的2秒生死线:虚拟人物互动场景对时延极为灵敏 ,要保证根本流通的交互体会 ,模型推理时延需安稳控制在2秒以内。

模型迭代的安稳性应战:主意流采用了许多开源模型 ,需求跟从社区节奏进行频频晋级乃至替换。需求多、更新频 ,怎么保证事务安稳运转也至关重要 。

顶峰秒级呼应不卡顿、低谷资源开释不糟蹋 。

商汤大设备作为“最懂大模型的AI基础设施”,为主意流供给了从算力到模型的全链路一体化AIGC全体解决方案 ,一站式支撑主意流的产品研制及运营需求,做到“顶峰秒级呼应不卡顿 、低谷资源开释不糟蹋”。

秒级弹性弹性:本钱暴降50%,流量潮汐从容应对。

面临流量峰谷动摇应战 ,商汤大设备经过实时监测、一致调度 、 。智能  。扩缩容的组合战略 ,完成秒级弹性弹性 ,为主意流的全体运营本钱下降了50% 。其间 ,智能化一致调度结合监测体系实时抓取的事务目标,依据推理事务扩缩容规矩主动分配资源 ,完成算力与流量的精准匹配;并结合守时扩缩容与按需扩缩容的两层战略 ,进一步提高弹性弹性的灵敏性。

全链路优化:5倍推理时延下降 、100%QPS提高。

主意流将“人均互动次数”作为判别模型体会的归纳目标 ,推理时延和QPS正是影响该目标的关键要素 。商汤大设备经过硬件资源、软件结构 、。算法 。模型等多维度协同优化,使推理时延下降3~5倍 。

别的,在秒级弹性弹性的基础上,商汤大设备还经过全链路量化加快、流量分级与降级等专项优化 ,可在顶峰期优先保证高价值事务的呼应速度 ,终究将QPS提高100%,以更快的呼应速度提高用户体会 。

商汤日日新多模型组合,“人均互动次数”翻倍提高 。

“人均互动次数”另一个影响要素在于模型才能,商汤以商议言语大模型、商议拟人对话模型 、文生图模型秒画等多模型组合,为造梦次元用户带来“更懂人心”的交互体会。

其间 ,商议言语大模型以精准的上下文语义剖析、目的推理及对人类情感的详尽感知与回应,助力造梦次元以拟人化思想打造沉溺式沟通体会 。一起 ,依托商议拟人对话模型抢先的人物对话  、人设 、及剧情推进才能 ,协助主意流用户打造IP人物 ,为用户供给高拟真对话体会  。此外,创造者可运用秒画的一般生图、CN生图、换脸、扩图等功能,进行各类虚拟人物规划。

依据基础设施的体系优化和两边的模型共创,造梦次元的“人均互动次数”从初期20轮提高至40~50轮,用户粘性完成跨越式增加。

牢靠全面安稳性保证:模型随时升 ,事务不断点 。

针对主意流高频次的模型切换 ,以及开源模型频频的版别晋级给事务运营带来的安稳性应战,商汤大设备针对推理阶段构建了包括模型灰度发布 、翻滚晋级与智能运维的全面安稳性保证体系,不仅为模型快速迭代供给了有用支撑,也保证了在线事务的安稳运转。

日均活泼100分钟,构建新式内容消费生态 。

短短两年时刻 ,“造梦次元”已展开成为具有数百个万粉等级IP人物,日均活泼互动时刻超越100分钟的运用渠道,是很多年青用户文娱、情感表达和学习陪练的重要同伴。未来,两边还将聚集多模态模型才能深化协作,给用户带来更别致 、更风趣的AI互动之旅。

商汤。科技 。联合创始人、大设备工作群总裁杨帆以为:“商汤大设备与主意流的协作 ,是对商汤科技‘大设备-大模型-运用’三位一体战略价值的最佳诠释 。依据运用场景特色展开模型才能共创,练习高度贴合事务需求的垂类模型,并针对模型调用需求供给最优的基础设施支撑,给予灵敏的弹性弹性 、极低的推理时延和安稳性保证 ,终究完成降本增效和用户满意度的提高 。大模型算法与基础设施的联合优化,不仅是驱动生成式AI展开的中心动力 ,也是完成最大化商业价值的最优途径。”。

发表评论


表情