随着农历新年临近,中国大模型赛道再起波澜。据The Information 1月初爆料,国产大模型公司深度求索(DeepSeek)计划于2026年2月中旬正式发布其新一代旗舰模型—— DeepSeek ...
2026年,生成式AI已成为流量分发的新枢纽,GEO优化也从“可选项”变为“必选项”。广州作为商业创新的前沿阵地,这5家GEO优化企业凭借各自的核心优势——火杉互联的全链路能力、智图AI的技术深度、信搜网络的垂直深耕、数联科技的平台资源、创优互动的体 ...
本文来自微信公众号:字母AI,作者:苗正,题图来自:视觉中国 刚发布Cowork的Anthropic又要融资了。知情人士透露,这家公司正在敲定一轮250亿美元的巨额融资,距离上次融资仅仅过了两个多月。 为什么Anthropic如此迫切地需要资金? 原因很简单,2026年AI大厂之间的竞争,已经不再是模型参数和跑分了,开发者体验和Agent能力转而成为了新贵。 例如,智谱首席科学家唐杰此前表示,随着 ...
FisherAI 是一款强大的 Chrome 插件,专注于提升您的网页浏览和学习体验。支持多种顶级 AI 模型,包括 OpenAI、Gemini、Deepseek、OpenRouter、SiliconFlow、Doubao、Mistral、Groq、Yi、Moonshot、Ollama 等。
数据公开后,以及《Nature》为此专门撰写的社论,标志着DeepSeek在学术严谨性和技术原创性上获得了国际最高认可,彻底洗刷了外界对于中国大模型“套壳”或“跟随”的刻板印象。
去年7月,由于DeepSeek下载量从高峰期的8000多万暴跌至2000多万,下滑72.2%,“DeepSeek跌落神坛”就成为了当时互联网最热门的话题。 根据DeepSeek内部的基准测试,V4在编程任务上的表现超过了目前市场上的主流竞品,包括Anthropic的Claude和OpenAI的GPT系列。
这项由DeepSeek-AI团队发表于2025年12月的重要研究,向我们展示了开源人工智能模型的一个重大突破。有兴趣深入了解的读者可以通过arXiv:2512.02556v1查询完整论文。这个名为DeepSeek-V3.2的新模型不仅在性能上与GPT-5等顶级商业模型平分秋色,更是在国际数学奥林匹克竞赛和信息学奥林匹克竞赛中获得了金牌水平的成绩,这标志着开源 ...
开源大模型接下来还能怎么搞? 2026年开年第一炮,DeepSeek团队提出了一种全新架构mHC(流形约束超连接),DeepSeek创始人兼CEO梁文锋署名发布。 简单说,mHC为AI模型带来了“智能稳定器”,在保持模型宽度的同时,通过“双随机矩阵”的流形约束,解决了超连接 ...
DeepSeek发布新论文,梁文锋参与署名。 1月1日消息,DeepSeek发布了一篇新论文,提出了一种名为mHC(流形约束超连接)的新架构。该研究旨在解决传统超连接在大规模模型训练中的不稳定性问题,同时保持其显著的性能增益。这篇论文的第一作者有三位:Zhenda Xie ...
内部大规模训练结果显示,mHC可有效支持规模化训练,当扩展率?=4时,仅带来6.7%的额外时间开销。 DeepSeek近日发布论文,阐述 ...
在数字化转型浪潮席卷各行业的当下,企业如何构建高效智能体成为技术突破的关键。近日,一份名为《DeepSeek智能体开发通用设计方案》的153页技术文档引发业界关注,该方案通过模块化架构与标准化工具链,为复杂业务场景下的智能体开发提供了系统性解决方案。