2026年初的AI界再次被一则重磅消息点燃——据多方信源证实,国产AI大模型领军者深度求索公司(DeepSeek)即将在春节前后正式发布其第四代大模型DeepSeek V4。这一备受期待的新版本被曝将具备 前所未有的编程能力 ...
大语言模型(LLMs)已逐步成为智能体实现推理、规划和工具调用的关键技术。目前提升 LLM 智能体能力的主要方法包括提示工程和智能体专用微调:前者通过精心设计的提示有效激发模型(如 ChatGPT 和 GPT-4 等商业模型)的智能体行为,但在开源 ...
什么值得买社区频道 on MSN

PyTorch Docker 容器化部署与生产运行实践

概述PyTorch是一款以Python为首要设计理念的深度学习框架,凭借简洁易用的Python接口、动态计算图机制及强大的灵活性,广泛应用于学术研究 ...
新年刚至,陈天桥携手代季峰率先打响开源大模型的第一枪,正式发布其自研的旗舰版搜索智能体模型—— MiroThinker 1.5 ,堪称智能体模型领域的最强“小钢炮”。最直观的体现来自基准测试的性能评测:面对GPT‑5‑High、Gemini‑3‑Pro、DeepSeek‑V3.2等一系列国内外顶尖模型,MiroThinker ...
新年伊始,陈天桥与代季峰共同开启了开源大模型的新篇章,推出了自研的旗舰搜索智能体模型——MiroThinker 1.5。这款模型被誉为智能体模型领域的“小钢炮”,在基准测试中表现卓越,毫不逊色于GPT-5-High、Gemini-3-Pro、DeepSeek-V3.2等国内外顶尖模型,充分展现了其强大的性能。 在当今的AI时代,传统的大型语言模型(LLM)面临着巨大的挑战。我们不禁思考:如果AI需 ...
数据公开后,以及《Nature》为此专门撰写的社论,标志着DeepSeek在学术严谨性和技术原创性上获得了国际最高认可,彻底洗刷了外界对于中国大模型“套壳”或“跟随”的刻板印象。
DeepSeek-V4的技术亮点体现在对数据模式的理解能力上。以“数草莓中字母r的数量”这一经典问题为例,上一代模型因无法理解“计数”概念,只能依赖训练数据中的错误答案,导致频繁出错。而新模型通过改进训练机制,能够真正理解任务本质,避免此类低级错误。团队还攻克了“灾难性遗忘”问题——在模型复杂度提升的过程中,V4保持了性能稳定性,未出现能力退化现象,这为构建编程Agent奠定了基础。
是一个用于构建和部署由大语言模型(LLMs)驱动的 AI Agent 和逻辑流程(Workflows)的可视化工具。它不仅提供了类似积木搭建式的可视化界面来快速创建Agent,还提供一套完整的API系统,使每个Agent都能轻松集成进任意技术栈的应用中。你可以将它看作是 AI 世界的 ...
去年7月,由于DeepSeek下载量从高峰期的8000多万暴跌至2000多万,下滑72.2%,“DeepSeek跌落神坛”就成为了当时互联网最热门的话题。 根据DeepSeek内部的基准测试,V4在编程任务上的表现超过了目前市场上的主流竞品,包括Anthropic的Claude和OpenAI的GPT系列。