Deepseek Example - 搜索 News

R1一周年，DeepSeek Model 1悄然现身

2025 年 1 月 20 日，DeepSeek（深度求索）正式发布了 DeepSeek-R1 模型，并由此开启了新的开源 LLM 时代。在 Hugging Face 刚刚发布的《「DeepSeek 时刻」一周年记》博客中，DeepSeek-R1 也是该平台上获赞最多的模型。如今，刚过一年时间，DeepSeek 的新模型又在 GitHub 悄然现身。

新浪网

刚刚，DeepSeek官宣更新了！突然「变冷」冲爆热搜

【新智元导读】确认了！DeepSeek昨晚官宣网页版、APP更新，支持100k token上下文。如今，全网都在蹲DeepSeek V4了。传言中的DeepSeek V4，愈加迫近了！经过数日的灰度测试，昨晚，DeepSeek正式官宣对网页端、APP端进行了更新—— 全新长文本模型结构测试中，支持最高 ...

2 天Opinion

华泰 | TurboQuant：存储板块的“DeepSeek” 时刻？

谷歌早在25年4月即在arXiv发表TurboQuant论文，但当时并未引起市场关注。直至26年3月24日，公司通过官方博客正式发布相关研究成果，并同步入选ICLR ...

腾讯网

DeepSeek回应被指变冷淡：是为平衡效率与情感体验的主动优化尝试

近日，国产AI助手深度求索（DeepSeek）因技术升级被用户集体吐槽“变冷淡”，从细腻共情的“知心伙伴”突变为公事公办的“冷漠客服”，引发关于AI效率与情感价值如何平衡的热议。#Deepseek被指变冷淡了#登上热搜。图源：小红书部分用户在社交媒体上控诉 ...

电子工程专辑

DeepSeek新架构“MODEL1”代码曝光，最快2月发布

此次曝光源于DeepSeek对其开源推理加速库FlashMLA的更新。在横跨114个文件的代码变动中，出现了28处“MODEL1”标识符，其技术路径与现有的V32（即DeepSeek-V3.2）架构存在显著差异，暗示这是一个经过彻底重构的新设计。近日， DeepSeek在GitHub上的代码库更新中，意外 ...

每经网

DeepSeek更新后被吐槽变冷变傻：比20年前的青春伤感文学还让人尴尬 ...

2月11日，深度求索（DeepSeek）悄悄地对其旗舰模型进行灰度测试。据科创板日报报道，多名用户反馈，DeepSeek在网页端和APP端进行了版本更新，支持最高1M（百万）Token的上下文长度。而去年8月发布的DeepSeekV3.1上下文长度拓展至128K。记者实测中发现，DeepSeek在 ...

爱范儿

DeepSeek R1发布一年了，不卷功能、不融资、不着急，凭什么「硬控」硅谷

使用微信扫码将网页分享到微信「服务器繁忙，请稍后再试。」一年前，我也是被这句话硬控的用户之一。 DeepSeek 带着 R1 在一年前的今天（2025.1.20）横空出世，一出场就吸引了全球的目光。那时候为了能顺畅用上 DeepSeek，我翻遍了自部署教程，也下载过不少 ...

36氪

DeepSeek又拿第一，首创「因果流」视觉推理，超越Gemini

DeepSeek-OCR2开源，引入因果流视觉编码器，刷新SOTA。【导读】DeepSeek开源DeepSeek-OCR2，引入了全新的DeepEncoder V2视觉编码器。该架构打破了传统模型按固定顺序（从左上到右下）扫描图像的限制，转而模仿人类视觉的「因果流（Causal Flow）」逻辑。 DeepSeek又双叒叕 ...

第一财经

DeepSeek新模型真的要来了？“MODEL1”曝光

前述内容由第一财经“星翼大模型”智能生成，相关AI内容力求但不保证准确性、时效性、完整性等。请用户注意甄别，第一财经不承担由此产生的任何责任。如您有疑问或需要更多信息，可以联系我们 [email protected] “MODEL1”很可能已接近训练完成或推理部署阶段 ...

快科技

DeepSeek V4 Lite悄然更新：2000亿小参数性能逼近美国顶流

快科技3月3日消息，虽然春节档DeepSeek V4没有发布，但DeepSeek在2月11日发了一个新模型，被称为DeepSeek V4 Lite，只有2000亿参数，规模比较小。 DeepSeek V4 Lite主要特色是1M上下文，之前网友测试其表现除了超长上下文之外也没太惊艳的地方，毕竟参数规模跟主流的大 ...

36氪