Using Copiter - 搜索 News

China.org.cn

China to promote tech-enabled elderly care to enhance seniors' well-being

BEIJING, Jan. 13 (Xinhua) -- China's central authorities have called for using advanced technologies, including brain-computer interfaces, exoskeleton robots and muscle suits, to assist elderly ...

搜狐

办公效率翻10倍：Gemini 2.5 Computer Use 改写AI操作逻辑，Nebula API让国内 ...

还在为跨平台数据整理、重复性表单填写消耗工时？还在困扰 AI 模型仅能输出文本却无法执行实际操作？谷歌最新发布的Gemini 2.5 Computer Use模型，正彻底改变这一现状 —— 作为专注界面控制的多模态大模型，它实现了从 "理解指令" 到 "执行操作" 的关键跨越 ...

51CTO

颠覆UI自动化：Gemini 2.5 Computer Use的技术与商业价值

长期以来，人工智能Agent（智能体）的活动范围，似乎一直局限于代码和API的数字世界。它们能理解语言、生成内容、调用接口，但始终无法像人类一样，直观地与我们每天都在使用的图形用户界面（GUI）进行交互。然而，谷歌DeepMind近期发布的Gemini 2.5 Computer Use ...

搜狐

谷歌 Gemini 2.5 Computer Use 发布：AI 浏览器操作新纪元，CUA 战场再燃

谷歌 DeepMind 今日凌晨正式发布了基于 Gemini 2.5的 Computer Use模型，引发了业界对 CUA (Computer-Using Agent)领域的广泛关注。继 OpenAI 之后，谷歌的入局无疑为这一领域注入了新的活力，预示着 AI 直接操控浏览器、与用户进行更自然交互的时代正在加速到来。 Gemini 2.5 ...

新浪网

谷歌加入CUA战场，发布Gemini 2.5 Computer Use：让AI直接操作浏览器

谷歌的 Computer Use 模型来了！今天凌晨，谷歌 DeepMind 重磅发布了基于 Gemini 2.5 的计算机使用模型 Gemini 2.5 Computer Use。考虑到前些天谷歌才刚刚发布了 Chrome DevTools (MCP)，Gemini 2.5 Computer Use 的诞生倒不是特别让人惊讶。简单来说，与 OpenAI 的 Computer-Using ...

IT之家

谷歌发布 Gemini 2.5 Computer Use 模型：专攻浏览器交互，支持 13 种操作

IT之家10 月 8 日消息，谷歌正在预览一款全新的 Gemini 人工智能模型，该模型旨在通过浏览器浏览网络并与之交互，使 AI 智能体能够在原本为人而非机器人设计的用户界面中执行操作。这款名为“Gemini 2.5 计算机使用”（Gemini 2.5 Computer Use）的模型，利用“视觉 ...

Microsoft

UI-E2I-Synth：为Computer Use Agent打造更真实、更具挑战性的开源Grounding ...

编者按：近年来，大模型在多模态交互中的应用不断深入，使得人机交互中的“理解能力”面临新的挑战。特别是在 Compute Use Agent 的发展背景下，如何准确理解用户的自然语言指令并将其映射到复杂 GUI 界面中的相应元素（即 “GUI Grounding” 任务）成为关键。

新浪网

你的Agent电脑助手正在踩雷！最新研究揭秘Computer-Use Agent的安全漏洞

更离谱的是，面对弹窗广告、钓鱼网站，甚至是试图绕过人机验证（reCAPTCHA）这种高危操作，Agent 们也是「勇往直前」。要是 ...

腾讯网

你的Agent电脑助手正在踩雷！最新研究揭秘Computer-Use Agent的安全漏洞

本文由上海 AI Lab、中国科学技术大学和上海交通大学联合完成。主要作者包括中国科学技术大学硕士生杨靖懿、上海交通大学本科生邵帅。通讯作者为刘东瑞和邵婧，上海 AI Lab 安全团队，研究方向为 AI 安全可信。从 Anthropic 的 Claude 3.5 Sonnet 自带 Computer-Use 功能 ...

澎湃新闻

OpenAI突然发布智能体API！支持网络和文件搜索以及computer use

「Agent/智能体」可说是当今 AI 领域最炙手可热的话题。今天凌晨，OpenAI 发布了一系列可让开发者通过 API 构建智能体的新工具，其中最大的看点便是 Responses API⁠，这是对之前的 Chat Completions API 的一轮大升级，使其获得了 Assistants API 般使用工具的能力，从而 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果

China to promote tech-enabled elderly care to enhance seniors' well-being

办公效率翻10倍：Gemini 2.5 Computer Use 改写AI操作逻辑，Nebula API让国内 ...

颠覆UI自动化：Gemini 2.5 Computer Use的技术与商业价值

谷歌 Gemini 2.5 Computer Use 发布：AI 浏览器操作新纪元，**CUA** 战场再燃

谷歌加入CUA战场，发布Gemini 2.5 Computer Use：让AI直接操作浏览器

谷歌发布 Gemini 2.5 Computer Use 模型：专攻浏览器交互，支持 13 种操作

UI-E2I-Synth：为Computer Use Agent打造更真实、更具挑战性的开源Grounding ...

你的Agent电脑助手正在踩雷！最新研究揭秘Computer-Use Agent的安全漏洞

你的Agent电脑助手正在踩雷！最新研究揭秘Computer-Use Agent的安全漏洞

OpenAI突然发布智能体API！支持网络和文件搜索以及computer use

谷歌 Gemini 2.5 Computer Use 发布：AI 浏览器操作新纪元，CUA 战场再燃