谷歌推出压缩算法实现约6倍内存节省

2026-03-28 02:30:18 财联社两砚网11

核心提示：谷歌近日推出了一种新的压缩算法TurboQuant，旨在降低人工智能系统的内存需求。该算法特别针对大语言模型和向量搜索引擎中的键值缓存瓶颈问题。随着上下文窗口的增大，这些缓存成为主要的内存瓶颈

谷歌近日推出了一种新的压缩算法TurboQuant，旨在降低人工智能系统的内存需求。该算法特别针对大语言模型和向量搜索引擎中的键值缓存瓶颈问题。随着上下文窗口的增大，这些缓存成为主要的内存瓶颈。TurboQuant可以在无需重新训练或微调模型的情况下，将键值缓存压缩至3比特精度，并且基本保持模型准确率不受影响。

测试结果显示，TurboQuant对包括Gemma和Mistral在内的开源模型实现了约6倍的键值缓存内存压缩效果。在英伟达H100加速器上的测试中，与未量化的键向量相比，该算法最高可实现约8倍的性能提升。研究人员表示，这项技术不仅适用于AI模型，还能增强大规模搜索引擎的向量检索能力。谷歌计划在2026年4月的国际学习表征会议上展示这一技术。

免责声明：以上所展示的信息由网友自行发布，内容的真实性、准确性和合法性由发布者负责。两砚网对此不承担任何保证责任, 两砚网仅提供信息存储空间服务。任何单位或个人如对以上内容有权利主张（包括但不限于侵犯著作权、商业信誉等），请与我们联系并出示相关证据，我们将按国家相关法规即时移除。

本文地址:http://news.liangyankj.com/news/265031.html

点赞 0收藏 0打赏 0

更多>同类资讯

狂人路上
加关注0
~~没有留下签名~~~~

推荐图文

金正恩:正式将韩国定	内存大涨价华强北姐
外甥正月没理发拉横幅	春分遇上“龙抬头”!

推荐资讯

点击排行

免责声明：本站所有信息均来自互联网搜集，产品相关信息的真实性准确性均由发布单位及个人负责，请大家仔细辨认！并不代表本站观点,两砚网对此不承担任何相关法律责任！如有信息侵犯了您的权益，请告知，本站将立刻删除。
友情提示：买产品需谨慎
网站处理与建议：wfmyw@qq.com

• 墨西哥对华热轧钢作出反倾销初裁征收临时反倾	• 海南自贸港封关百日成绩发布外贸进出口显著增
• 女儿险遭性侵巴西母亲怒杀男子获释正当防卫引	• 海底捞陷“点炮”风波管理争议再起
• 西班牙女孩遭性侵后申请安乐死获准体面离世引	• 以军或又在黎南部使用白磷弹引发国际关注
• 20岁女生引爆美股至暗时刻科技股集体重挫	• 多只热门股封单均超3亿元市场情绪高涨
• 评论员批日方就强闯中国使馆事件敷衍质疑政府	• 妖无二烤肉店菜品出现活体蚯蚓市监部门约谈整
• 中方回应中国博士后遭美方盘问后自杀严正交涉	• 北约2025年防务开支逾1.4万亿美元成员国大幅增
• 一中国博士后遭美方盘问后自杀身亡外交部提出	• 库拉索首发身价是国足2倍年轻国足逆袭取胜
• 一名中国博士后遭美方盘问后自杀身亡悲剧引发	• 丰田在华发起14年来最大召回计划涉及56万辆汽
• 伊朗称已被特朗普欺骗了两次信任危机加剧

谷歌推出压缩算法 实现约6倍内存节省

谷歌推出压缩算法实现约6倍内存节省