Conditional Language - 搜索 News

6 天

DeepSeek发布梁文锋署名新论文，提出“条件记忆”，开源相关记忆 ...

【太平洋科技快讯】 1 月 13 日消息，据《科创板日报》报道，DeepSeek 于 12 日晚发布最新研究论文《Conditional Memory via Scalable Lookup: A New Axis of Sparsity for ...

3 天

DeepSeek 新发现：给 AI 递一张“作弊小抄”，它的数学和代码能力竟然 ...

DeepSeek-AI 与北京大学的重磅论文《Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models》 ...

1 小时

智谱与MiniMax上市后，“六小虎”路径分化

随着智谱AI与MiniMax相继上市，曾被市场冠以“AI大模型六小虎”称号的几家企业，其发展路径已现分化。尚未上市的几家公司，纷纷表态账上仍有充足现金，并不急于上市。

新京报 on MSN

解析梁文锋署名DeepSeek新论文：让记忆和计算分开

根据研究人员测试，模型在处理超过5轮的多步骤逻辑推理任务时，会出现关键信息丢失的现象。在企业客服场景，模型无法长期记住用户的个性化需求；在医疗问诊场景，患者此前提及的病史、用药禁忌可能被忽略；在代码生成场景，跨文件的函数调用逻辑易出现混乱。

腾讯网

DeepSeek公布全新论文，梁文锋署名

【TechWeb】1月13日消息，DeepSeek最新公布题为《Conditional Memory via Scalable Lookup:A New Axis of Sparsity for Large Language ...

观点网 on MSN

DeepSeek发布新论文同时开源相关记忆模块Engram

观点网讯： 1月12日晚间，DeepSeek发布新论文《Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language ...

电脑之家PChome.net

北京大学与DeepSeek共同完成新论文：打造全新条件记忆架构

2026年1月13日消息，据新浪科技报道，DeepSeek于12日晚发布新论文《Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models》（基于可扩展查找的条件记忆：大型语言模型稀疏性的新维度）。

腾讯网

从 DeepSeek 两篇开年论文，看 2026 AI：架构创新的接力赛

2025年开局非常热闹，特别是在大模型LLM的技术圈子里。DeepSeek团队是在新年当天以及过后没几天，接连发布了两篇梁文峰署名的论文。《mHC: Manifold-Constrained ...

21IC电子网

DeepSeek发布梁文锋署名新论文 V4有望支持全新记忆架构

1月13日消息，今日，DeepSeek发布新论文《Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models》 (基于可扩展查找的条件记忆：大型语言模型稀疏性的新维度)。

3 天

DeepSeek联合北京大学提出“条件记忆”开源Engram模块

本报讯　1月12日，深度求索（DeepSeek）联合北京大学提出“条件记忆”（Conditional Memory）作为大语言模型稀疏化的新维度，并开源其核心模块Engram。相关成果已在论文Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models中发布。

6 天

2026年1月13日，DeepSeek与北京大学合作发布新论文《Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models》，创始人梁文锋为合著作者之一。论文提出条件记忆（conditional memory）概念，通过可扩展查找结构解决大语言模型知识检索效率低下的问题。同日，团队 ...

i黑马

DeepSeek发布梁文锋署名新论文

1月12日晚，DeepSeek发布新论文《Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models》，该论文由北京大学与DeepSeek团队共同完成，作者署名中出现DeepSeek创始人梁文锋。12日，DeepSeek开源相关记忆模块Engram。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果