导语:阿德莱德大学助理教授吴琦回顾了他从跨领域图像识别到 Vision-to-Language 相关的研究思路,如今正将研究领域延伸到与 Action 相关的工作。 雷锋网 AI 科技评论按:本文作者为阿德莱德大学助理教授吴琦,他在为雷锋网 AI 科技评论投递的独家稿件中回顾了他 ...
导语:在经典的 vision-language 任务上,能够增长的空间已经很小,已经过了暴力的通过数据去学习的阶段。真正的挑战其实是一些细分的领域。 雷锋网 AI 科技评论按:本文作者为阿德莱德大学助理教授吴琦,去年,他在为 AI 科技评论投递的独家稿件中回顾了他 ...
2025年,随着智能驾驶开始往深度和广度两个方向去卷,智能驾驶行业往迎来一个显著信号:端到端大模型迈向2.0时代,VLA(Vision-Language-Action,视觉-语言-动作模型)或将成为国内车企全面竞争的焦点。 作为继VLM(视觉-语言模型)之后的进化形态,VLA通过整合 ...
太卷了,智能驾驶在国内的落地发展太迅速了,从体验功能端,大家开城大战打完了之后就进入点到点的落地战,点到点弄完了之后肯定Robotaxi大战;而在硬核的软件技术端,端到端大模型战在华为这个月宣布急攻端到端大模型的信息下,已经算是进入焦灼状态。
DoNews on MSN
消息称理想汽车基座模型负责人陈伟将离职,詹锟接棒
DoNews1月14日消息,据新智驾报道,多位知情人士透露,理想汽车近期架构变动,詹锟将承接VLA(视觉语言动作模型,Vision-Language-Action)整合研发相关工作并向CTO汇报。与此同时,负责LLM方向的陈伟将于近期离职,交接正在进 ...
当前正在显示可能无法访问的结果。
隐藏无法访问的结果