IT之家1 月 22 日消息,小米创办人、董事长兼 CEO 雷军今日宣布,小米多项 AI 创新成果入选国际顶级会议 ICASSP 2026,包括音频理解、音乐生成评估、通用音频 - 文本预训练、视频到音频合成等多个 AI 领域的技术研究成果。 IT之家注:ICASSP 是全球音频领域最具权威性与影响力之一的国际顶级学术会议,第一次会议于 1976 年在美国的费城举办,至今已有近 50 年的历史。I ...
自动驾驶赛道,2026公认关键词之一,就是——收敛。 技术上,多模态大模型、数据驱动、强化学习等新范式,展现出阶段性“终局”特性:统一L2+、L4的技术方案,正在被越来越多的玩家押注。
感知模块是AI ...
对话灵感实验室:Glint-MVT v2.0 统一图像和视频,助力提升VLM视频分析效率与能力,解码器,编码器,mvt ...
DeepMind在世界模型方向上有多条并行的研究路线。Hassabis提到的Genie(交互式世界模型)侧重于从文本或图像生成可交互的3D环境,最新的Genie 3可以实时生成720p、24fps的交互世界,用于训练embodied ...
基于上述问题,快手在业界首次提出端到端的生成式统一查询推荐框架 ——OneSug,成功将召回、粗排、精排等多个阶段统一在一个生成模型中,显著提升了推荐效果与系统效率,在快手电商场景中实现了业务指标与用户体验的双重提升。
InfoQ中国 on MSN
产业级 agent 如何破局? 百度吴健民:通用模型难通吃,垂直场景才是 ...
本文为《2025 年度盘点与趋势洞察》系列内容之一,由 InfoQ 技术编辑组策划。本系列覆盖大模型、Agent、具身智能、AI Native 开发范式、AI 工具链与开发、AI+ ...
智谱联合华为发布GLM-Image,国产全栈算力底座验证SOTA多模态模型能力。2026年1月14日,新一代图像生成模型GLM-Image正式开源,该模型基于昇腾Atlas 800T ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果