GPU Cache - 搜索 News

7 天

国产存储突破：绿算GP7000率先适配英伟达G3层KV Cache架构，AI推理效率 ...

国产存储突破：绿算GP7000率先适配英伟达G3层KV Cache架构，AI推理效率提升17倍,英伟达,gpu,黄仁勋 ...

12 天

AI推理下半场决战！英伟达DPU刚发布，国产黑科技已抢跑超车？

事实上，在中国早已有一家厂商的方案率先问世，那就是华为基于DPU的智能盘框方案。早在2025年9月的《数据存储教授论坛》上，华为便率先发布了业界首创的“基于DPU智能盘框的AI推理加速方案”。

AI推理下半场决战！英伟达DPU刚发布，国产黑科技已抢跑超车？

无它。因为它是英伟达的老黄（黄仁勋）在最近的CES 2026上最新提出的一个词儿。所谓ICMS，是英伟达（NVIDIA）CEO黄仁勋最新发布的基于BlueField-4 新一代DPU的推理上下文内存存储（ Inference Context Memory Storage）平台。这个平台的发布，意味着AI Infra的竞争焦点，将 ...

英伟达自己做了一套KV Cache存储，把SSD市场引爆了

而在2026年的CES上，英伟达直接自己做了一套面向KV Cache的存储层。由于英伟达的KV Cache存储层明确采用了SSD，而当前SSD市场正受供应紧张和价格上涨的影响，本就紧俏的市场再次被推向高潮。

国产存储突破：绿算GP7000率先适配英伟达G3层KV Cache架构，AI推理效率 ...

2026年1月15日，北京 —— 继英伟达CEO黄仁勋在CES 2026发布革命性“推理上下文内存存储平台”后，本土高性能存储厂商绿算技术（ForinnBase）今日宣布，其旗舰产品GP7000系列全闪存储平台已通过英伟达适配，成为全球首批、也是唯一支持G3级KV Cache分层存储的国产 ...

AI推理刚需，NAND“周期更长更稳”！摩根大通：本轮主角是eSSD，铠侠 ...

别再盯着GPU和HBM高带宽内存了，AI推理浪潮正在让NAND闪存摆脱“强周期商品”的宿命，演变成一种高增长的AI基础设施资产。据追风交易台消息，1月23日，摩根大通亚太区科技研究团队发布深度研报《半导体：NAND——更长、更强的上升周期》，宣告NA ...

10 天

6颗芯片组成的AI计算机：老黄是怎么用1.7x晶体管做到5x性能提升的？

然后就是真正的、超节点域内的高速实现，用于scale-up的NVLink Switch交换芯片了。Vera Rubin NVL72系统内的NVLink交换设备内总共有4颗第六代NVLink ...

不止于量化：最新综述用「时-空-构」三维视角解构KV Cache系统级优化

随着 LLM 向 1M 上下文演进，KV cache（键值缓存）已成为制约推理服务效率的核心瓶颈。自回归生成的特性使得模型必须存储历史 token 的 key-value 状态（即 KV cache）以避免重复计算，但 KV cache ...

1 小时

你需要NAS的原因可能不是存不下而是跟不上节奏

当文件量上来之后，真正拖慢效率的往往不是存不下，而是找不到、理不清、用起来麻烦。AI在NAS上更现实的落点，就是围绕照片、视频、文档这些内容做识别、分类与检索，把用户的管理成本降下来。

商业新知 on MSN

CPU与GPU区别和发展进程

本文深入分析了中央处理器(CPU)与图形处理器(GPU)的核心架构差异、计算范式特点、历史发展脉络及当前技术难点与未来趋势。研究发现，CPU采用冯·诺依曼架构，具备复杂控制单元和多级缓存，擅长顺序处理与分支预测，是通用计算的核心；而GPU基于SIMT ...

14 天

SRAM，取代HBM？

因此，“SRAM 取代 HBM”是一个伪命题，真正的命题是「AI 推理如何实现 TCO 最 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果