整理 | Tina现在,大模型可以独立写完整整一个浏览器了?Cursor CEO Michael Truell 最近分享了一项颇为吸睛的实验:他们用 GPT-5.2 让系统连续不间断运行一周,从零构建出一个“可用”的 Web ...
1月12日,Anthropic发布了一款新产品Cowork。官方给它的定义很有意思:Claude Code for the rest of your work,给剩下那些不写代码的人用的Claude Code。
据了解,在近日即将发布的AI编程智能体榜单(SWE-bench 相关测评)中,其凭借自研的Vinsoo 3.0云端Agent,在没有任何人类干预的前提下,不仅大幅超越了硅谷的一众独角兽,更在复杂任务处理成功率上刷出了世界第一的SOTA效果。
作为参照,Firefox有3100万行代码,WebKit约1900万行,Chrome也超过3000万行。这些都是二十多年持续开发的成果。一周产出300万行,听起来惊人,但有人指出:代码行数从来不是衡量软件完成度的标准。
知名 AI 编程辅助工具Cursor近日分享了一项内部测试发现:在处理超长程、自主性的编程任务时,OpenAI 最新的GPT-5.2模型表现出比 Anthropic 的Claude Opus4.5更高的可靠性。为了验证模型能力,Cursor 团队尝试从零开始构建一个功能完备的Web 浏览器,涵盖了 HTML 解析、CSS 布局及自定义 Javas cript 虚拟机等复杂底层架构。
知名 AI 编程辅助工具 Cursor 近日分享了一项内部测试发现:在处理超长程、自主性的编程任务时,OpenAI 最新的 GPT-5.2 模型表现出比 Anthropic 的 Claude Opus4.5 更高的可靠性。为了验证模型能力,Cursor 团队尝试从零开始构建一个功能完备的 Web 浏览器 ,涵盖了 HTML 解析、CSS 布局及自定义 JavaScript 虚拟机等复杂底层架构。
后来出现了所谓的Agentic编程——Claude Code、Cursor Agent、Windsurf等工具让AI可以自主执行多步任务,读取文件、运行命令、修复错误。 直到GPT-5.2。 Cursor团队让GPT-5.2持续运行了 整整一周 ...
Theo透露了一个让很多人震惊的数据:在他自己的工作中,以及他运营和顾问的多个团队里,现在70%到90%的代码是AI生成的。
李国平: 从实际落地来看,渐进式创新更为现实:先在现有业务流程引入智能体,但终极来看,复杂的业务流程未来会变成“人与智能体协同”的模式,这是对传统SaaS和企业内部业务系统的完全重构。
1月12日消息,在与 Link Ventures 的创始人 Dave Blundin 的对话中,Elon Musk预见,未来的 AI 领域将主要由几大巨头主导,包括 Google、他的 xAI,以及来自中国的强大力量。他特别指出,基于当前的趋势,中国在 AI 算力方面“将远远超过世界其他国家的总和”。中国在电力生产上的巨大优势,以及其解决芯片制造问题的决心,将使其成为 AI 领域一个极其重要的玩家 ...
当时Anthropic指控OpenAI的工程师使用Claude的开发者API接入内部工具来对GPT-5的组件进行基准测试或训练,这被视为违反了商业条款。 Anthropic联合创始人Jared Kaplan谈到此次限制访问时表示:我觉得我们把 Claude卖给OpenAI会很奇怪。
AI的确擅长处理简单问题,一旦问题变得复杂、棘手,人们还是更愿意和真实的人交流。 令人惊掉下巴的是,在这个流量急剧下降的时期,Stack Overflow年收入还创下了新高——高达1.15亿美元,直接翻番。