Lage Language Model PDF

2 小时

DeepSeek 突发梁文峰署名新论文：V4 新架构提前曝光？

今天凌晨，喜欢闷声做大事的 DeepSeek 再次发布重大技术成果，在其 GitHub 官方仓库开源了新论文与模块 Engram，论文题为 “Conditional Memory via Scalable Lookup: A New Axis of ...

9 天

DeepSeek 新发现：给 AI 递一张“作弊小抄”，它的数学和代码能力竟然 ...

DeepSeek-AI 与北京大学的重磅论文《Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models》 ...

腾讯网

梁文锋署名开源“记忆”模块，DeepSeek V4更细节了

机器之心编辑部就在十几个小时前，DeepSeek 发布了一篇新论文，主题为《Conditional Memory via Scalable Lookup:A New Axis of Sparsity for Large Language Models ...

10 天

中国汽车工业协会软件分会：2025年AI大模型车载软件平台白皮书

今天分享的报告是《2025年AI大模型车载软件平台白皮书》，版权归中国汽车工业协会软件分会所有。近年来，人工智能(ArtificialIntelligence，以下简称:AI)领域伴随着ChatGPT、GenAI、AGI等不断演进，实现了快速突破，人工智能大模型(以下简称:AI大模型或大模型)逐渐应用到汽车领域。例如大语言模型(Large Language Model,LLM)及其他先进的Gen ...

12 天

刚刚，梁文锋署名开源「记忆」模块，DeepSeek V4更细节了

就在十几个小时前，DeepSeek 发布了一篇新论文，主题为《Conditional Memory via Scalable Lookup:A New Axis of Sparsity for Large Language ...

腾讯网

DeepSeek最新论文：直指Transformer要害，让AI学会翻“字典”了

今日凌晨，DeepSeek 在 GitHub 上发布了一项代号为“Engram”的最新研究成果，并同步上传了题为Conditional Memory via Scalable Lookup: A New Axis of Sparsity for ...

雷峰网

清华孙茂松团队 × 深言科技：以解释作为训练信号，让 8B 模型在 ...

在这样的背景下，清华大学孙茂松团队联合深言科技提出了新论文《FaithLens: Training Large Language Models to Detect Hallucinations with Useful ...

雷峰网

人大高瓴赵鑫团队新作：先拆掉 RLVR，再重建推理模型训练

正是在这样的背景下，来自人大高瓴学院的赵鑫团队把注意力放在了这一核心问题上。他们没有急于再提出一个更大的模型或更复杂的算法，而是刻意退后一步，围绕 RLVR ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果