具身智能、人形机器人领域在模型端比如在视觉-语言-动作(Vision-Language-Action,VLA)模型、预训练阶段在过去一年里有明显提升,但一旦进入真实场景,机器人能否稳定、高效、长时间地完成具体任务,仍然是一个问号。1月6日,智元机器人 ...
导语:在经典的 vision-language 任务上,能够增长的空间已经很小,已经过了暴力的通过数据去学习的阶段。真正的挑战其实是一些细分的领域。 雷锋网 AI 科技评论按:本文作者为阿德莱德大学助理教授吴琦,去年,他在为 AI 科技评论投递的独家稿件中回顾了他 ...
2025年,随着智能驾驶开始往深度和广度两个方向去卷,智能驾驶行业往迎来一个显著信号:端到端大模型迈向2.0时代,VLA(Vision-Language-Action,视觉-语言-动作模型)或将成为国内车企全面竞争的焦点。 作为继VLM(视觉-语言模型)之后的进化形态,VLA通过整合 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果