Memory Models - 搜索 News

6 天

DeepSeek 新发现：给 AI 递一张“作弊小抄”，它的数学和代码能力竟然 ...

DeepSeek-AI 与北京大学的重磅论文《Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models》 ...

18 小时

老旧服务器升级优化延长寿命

我们相信，技术资产的“老去”是必然，但“衰老”不等于“报废”。通过专业、精准的干预，完全可以让老旧服务器焕发“第二春”，在控制成本的同时，安全、平稳地支撑业务过渡到下一代基础设施。返回搜狐，查看更多 ...

6 小时

DeepSeek新模型曝光？

2025年2月，DeepSeek启动“开源周”，计划以每日解锁的形式逐步公开5个代码库，Flash MLA为首个开源项目。公开资料显示，Flash MLA通过优化Hopper ...

腾讯网

DeepSeek“王炸”前瞻：意外曝光的Model1，会是GPT-5的终极对决者吗

在过去一年中，DeepSeek 以“小步快跑”的方式持续推进 V3 模型的迭代，重点围绕复杂推理、编程能力和工具调用等方向进行深度优化与架构创新，同时将 R1 作为稳定基线持续赋能生态。业界之所以猜测DeepSeek会在今年春节复刻去年R1的“核爆 ...

腾讯网

超越代表作Mem0！阿里&武大提出智能体记忆新范式Agentic Memory，统一长 ...

大语言模型（LLM）智能体在长周期推理任务中面临根本性限制，这主要源于有限的上下文窗口，使得有效的记忆管理变得至关重要。现有方法通常将长期记忆（LTM）和短期记忆（STM）作为独立组件处理，依赖于启发式规则或辅助控制器，这严重限制了自适应性和端到端优 ...

5 天

DeepSeek联合北京大学提出“条件记忆”开源Engram模块

本报讯　1月12日，深度求索（DeepSeek）联合北京大学提出“条件记忆”（Conditional Memory）作为大语言模型稀疏化的新维度，并开源其核心模块Engram。相关成果已在论文Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models中发布。

2 天

智谱与MiniMax上市后，“六小虎”路径分化

随着智谱AI与MiniMax相继上市，曾被市场冠以“AI大模型六小虎”称号的几家企业，其发展路径已现分化。尚未上市的几家公司，纷纷表态账上仍有充足现金，并不急于上市。

5 天

UK charity put 10 endangered species on priority list to help in 2026 英国慈善组织将 ...

一种彩虹色的狼蛛、一种毒蛇和一种手指呈钩状的毛茸茸的长臂猿之间有什么联系？它们都被列入了一份高度濒危物种的名单中，一英国慈善组织表示将于今年优先救助这份名单上的动物。

天天基金网

智谱与MiniMax成功上市后 “六小虎”路径分化 AGI还是全力争夺的 ...

随着智谱 AI与MiniMax相继上市，曾被市场冠以“AI大模型六小虎”称号的几家企业，其发展路径已现分化。尚未上市的几家公司，纷纷表态账上仍有充足现金，并不急于上市。

12 小时

编者按：本文来源于微信公众号“机器之心”（ID：almosthuman2014），作者赵云峰，36氪经授权发布。 Demiurge Technologies 是一家位于瑞士的人工智能创业公司，他们致力于研究生物神经元的计算原理，开发下一代深度学习，以解决小样本学习和与物理世界交互的难题。他们的深度学习系统将应用于第四级别自动驾驶和探索机器人等领域。与大部分人工智能公司不同的是，Demiurge T ...