尽管扩散模型(Diffusion Model)与流匹配(Flow Matching)已经把文本到图像生成(Text-to-Image, ...
本文为《2025 年度盘点与趋势洞察》系列内容之一,由 InfoQ 技术编辑组策划。本系列覆盖大模型、Agent、具身智能、AI Native 开发范式、AI 工具链与开发、AI+ ...
更紧迫的压力来自资本市场。2024年以来,投资者对智能汽车企业的估值逻辑已从“交付量”转向 “AI能力” 。摩根士丹利最新报告指出,未来三年,智能驾驶软件收入占车企总营收的比例将从目前的不足5%提升至15%-20%。
36氪获悉,近日AI创企“生数科技”完成了近亿元的天使轮融资。此轮融资由蚂蚁集团领投,BV百度风投、卓源资本跟投,目前企业估值已达1亿美金。资金主要将用于核心研发团队的建设,加速多模态大模型和应用产品的研发。
智谱AI一位研究员周三对《环球时报》表示,通过与华为紧密合作,团队在昇腾Atlas 800T A2设备上完成了从数据准备到大模型训练、推理适配的全流程,经联合调试优化后,训练性能已接近目标硬件的实用极限。
尽管多模态大模型使AI能够根据图像内容推理复杂问题,但仍无法像视觉感知系统那样在图像上精确定位指令对应的目标区域。 因此,香港中文大学贾佳亚团队提出 LISA(Large Language Instructed Segmentation ...
作为国资央企、全球领先的综合智能信息服务运营商,中国电信不仅拥有覆盖海陆空天的通信网络基础设施,更具备将前沿 AI 技术与实际通信场景深度融合的能力。 无论是你要看的 Netflix、B站,还是微信视频通话,背后主要依靠的是 HEVC(H.265)或 ...
DeepMind在世界模型方向上有多条并行的研究路线。Hassabis提到的Genie(交互式世界模型)侧重于从文本或图像生成可交互的3D环境,最新的Genie 3可以实时生成720p、24fps的交互世界,用于训练embodied ...
作为赫尔利斯系统的计算核心,MI450基于AMD新一代CDNA 4架构打造,定位高端AI训练与推理场景,相较前代产品实现了架构级的全面升级。其核心创新在于采用“异构计算单元重构+内存带宽倍增”的设计思路,同时优化了AI专用指令集与能效控制模块。
吉利汽车日前发布了面向未来的核心技术体系,包括智能座舱WAM模型、涵盖全域智能的AI 2.0架构,以及可实现高阶智能驾驶的千里浩瀚G-ASD平台;博世则展出了全新AI智能座舱平台与全球首发的第七代毫米波雷达。