您的当前位置:首页 > 热点 > 华为发布AI推理创新技术UCM:实现高吞吐、低时延推理体验,降低每Token推理成本 正文
时间:2025-08-23 23:52:04 来源:网络整理 编辑:热点
新浪科技讯 8月12日下午消息,在2025金融AI推理应用落地与发展论坛上,华为联合中国银联共同发布AI推理创新技术UCM推理记忆数据管理器),实现高吞吐、低时延的推理体验。在当今数字化时代,AI发展
新浪科技讯 8月12日下午消息,发布在2025金融AI推理应用落地与发展论坛上,推理吞吐n推华为联合中国银联共同发布AI推理创新技术UCM(推理记忆数据管理器),创新实现高吞吐、技术低时延的现高推理体验。
在当今数字化时代,低时低AI发展日新月异。延推验降大模型训练的理体理成热潮尚未消退,AI推理体验却已悄然成为AI应用的发布关键。中信建投在2025WAIC期间发布的推理吞吐n推白皮书指出,AI正从训练向推理的创新结构性转变而快速增长。在这样的技术大背景下,AI推理体验的现高重要性愈发凸显。
推理体验直接关系到用户与AI交互时的低时低感受,包括回答问题的延推验降时延、答案的准确度以及复杂上下文的推理能力等方面。资料显示,国外主流模型的单用户输出速度已进入200 Tokens/s区间(时延5ms),而我国普遍小于60Tokens/s(时延50 - 100ms),如何解决推理效率与用户体验的难题迫在眉睫。
据介绍,华为此次发布的AI推理创新技术UCM(推理记忆数据管理器),作为一款以KV Cache为中心的推理加速套件,其融合了多类型缓存加速算法工具,分级管理推理过程中产生的KV Cache记忆数据,扩大推理上下文窗口,以实现高吞吐、低时延的推理体验,降低每Token推理成本。
责任编辑:郭栩彤
“爱心妈咪小屋”凝聚大爱 上海市总工会呼吁共同推动创建家庭友好型工作场所2025-08-23 23:28
《银河战士Prime4》确认将于今年晚些发售 8月在加拿大提供试玩2025-08-23 23:13
On昂跑云南首店于昆明恒隆广场盛大开业2025-08-23 23:04
我真没想带歪奥特之星2025-08-23 23:00
写作方法:百里挑一选材2025-08-23 22:38
《博德之门3》总监透露:拉瑞安新作将带来超多乐趣2025-08-23 22:08
三国:开局继承了梁山2025-08-23 22:05
《银河战士Prime4》确认将于今年晚些发售 8月在加拿大提供试玩2025-08-23 21:45
写作方法:百里挑一选材2025-08-23 21:44
中国马术协会三级技术官员培训考核(天津站)顺利举办2025-08-23 21:27
公牛官方:明年1月25日为罗斯举办球衣退役仪式2025-08-23 23:50
2023年四川乐山中考作文题目:材料作文2025-08-23 23:43
从濒临灭绝到数量回升,黑脸琵鹭保护工作取得显著成效2025-08-23 23:43
EA总裁暗示:更多迪士尼和漫威游戏正在开发中!2025-08-23 22:46
梅雨季到来,身心都要防“霉变”2025-08-23 22:46
“希望杯”全国数学邀请赛2025-08-23 22:46
腾讯音乐2025Q2财报:总收入84.4亿元 调整后净利润26.4亿元2025-08-23 22:43
芜湖市:弘扬文明风尚 “好人”畅游繁昌2025-08-23 22:06
浦东举办上海城市业余联赛“火焰蓝杯”定向赛2025-08-23 21:50
木瓜的功效与作用及禁忌2025-08-23 21:10