谷歌一篇论文引爆存储芯片崩盘,AI内存需求暴降6倍,推理狂飙8倍

谷途2026-03-28阅读 200
论文给出了严格的理论证明:TurboQuant的MSE失真率,在所有位宽下都控制在理论绝对下限的约2.7倍以内。在1-bit极端压缩的情况下,更是只有最优值的约1.45倍。 谷歌在LongBench、Needle In A ...