整理 | Tina现在,大模型可以独立写完整整一个浏览器了?Cursor CEO Michael Truell 最近分享了一项颇为吸睛的实验:他们用 GPT-5.2 让系统连续不间断运行一周,从零构建出一个“可用”的 Web ...
Cursor 口中所谓的「突破性进展」,本质上就是一堆缺乏工程逻辑的「AI 泔水」(AI Slop)。他们所做的,其实在宣传上玩了一手漂亮的「障眼法」,让所有人都以为这个项目真的跑通了。但实际上,这根本就是一堆无法运行的废代码。
【新智元导读】GPT-5.2连肝7天造出浏览器的事,刚刚被打假了!一位开发者发文证实,Cursor这个项目就是个「AI泔水」,代码根本无法编译。Cursor这次可太心急了。
AI编程领域近日爆出一桩争议事件:某团队宣称其研发的GPT-5.2驱动编码系统,在连续运行168小时后成功生成具备Chrome功能的浏览器代码库,规模达300万行。这项被包装成"自主编程里程碑"的成果,在技术社区引发轩然大波后被证实存在严重造假嫌疑。
后来出现了所谓的Agentic编程——Claude Code、Cursor Agent、Windsurf等工具让AI可以自主执行多步任务,读取文件、运行命令、修复错误。 直到GPT-5.2。 Cursor团队让GPT-5.2持续运行了 整整一周 ...
知名 AI 编程辅助工具Cursor近日分享了一项内部测试发现:在处理超长程、自主性的编程任务时,OpenAI 最新的GPT-5.2模型表现出比 Anthropic 的Claude Opus4.5更高的可靠性。为了验证模型能力,Cursor 团队尝试从零开始构建一个功能完备的Web 浏览器,涵盖了 HTML 解析、CSS 布局及自定义 Javas cript 虚拟机等复杂底层架构。
知名 AI 编程辅助工具 Cursor 近日分享了一项内部测试发现:在处理超长程、自主性的编程任务时,OpenAI 最新的 GPT-5.2 模型表现出比 Anthropic 的 Claude Opus4.5 更高的可靠性。为了验证模型能力,Cursor 团队尝试从零开始构建一个功能完备的 Web 浏览器 ,涵盖了 HTML 解析、CSS 布局及自定义 JavaScript 虚拟机等复杂底层架构。
知名AI编程辅助工具Cursor近期公布了一项内部测试成果,其团队通过极端场景验证了不同大语言模型在复杂工程任务中的表现差异。测试结果显示,OpenAI最新推出的GPT-5.2模型在处理超长周期、高自主性的编程任务时,展现出显著优于Anthropic旗下Claude Opus4.5的工程可靠性。这项发现为AI在大型软件项目中的应用提供了重要参考。
作为参照,Firefox有3100万行代码,WebKit约1900万行,Chrome也超过3000万行。这些都是二十多年持续开发的成果。一周产出300万行,听起来惊人,但有人指出:代码行数从来不是衡量软件完成度的标准。
Cusor 分享了他们在使用 Agent 编码的最佳实践,原文较长,链接在文末,PaperAgent对核心内容进行了提炼: 编码 Agent 正在改变构建软件的方式。 模型现在可以连续运行数小时,完成大规模的多文件重构,并持续迭代直到测试通过。但要充分发挥 Agent 的能力,你 ...
1月12日,Anthropic发布了一款新产品Cowork。官方给它的定义很有意思:Claude Code for the rest of your work,给剩下那些不写代码的人用的Claude Code。
Cursor 最近发布了一篇博客《Dynamic Context Discovery》,分享了他们在 AI Agent上下文管理上的最新实践思路。 说实话,这篇文章读完让人有点“既视感”——之前 Manus 的创始人 Peak 在访谈中提到,当看到大模型公司发类似研究博客时,他们往往是“既开心又无奈 ...