Encoder 4 - 搜索 News

3 天

雷军官宣小米多项 AI 创新成果入选国际顶级会议 ICASSP 2026，包括音频 ...

IT之家1 月 22 日消息，小米创办人、董事长兼 CEO 雷军今日宣布，小米多项 AI 创新成果入选国际顶级会议 ICASSP 2026，包括音频理解、音乐生成评估、通用音频 - 文本预训练、视频到音频合成等多个 AI 领域的技术研究成果。 IT之家注：ICASSP 是全球音频领域最具权威性与影响力之一的国际顶级学术会议，第一次会议于 1976 年在美国的费城举办，至今已有近 50 年的历史。I ...

轻舟智航进入第一梯队： L2+量产超百万成最大黑马，城市NOA量产下放 ...

自动驾驶赛道，2026公认关键词之一，就是——收敛。技术上，多模态大模型、数据驱动、强化学习等新范式，展现出阶段性“终局”特性：统一L2+、L4的技术方案，正在被越来越多的玩家押注。

AI Agent核心技术架构解析

感知模块是AI ...

5 天

对话灵感实验室：Glint-MVT v2.0 统一图像和视频，助力提升VLM视频分析 ...

对话灵感实验室：Glint-MVT v2.0 统一图像和视频，助力提升VLM视频分析效率与能力,解码器,编码器,mvt ...

5 天

DeepMind世界模型研究员：是否Transformer架构不重要，AGI瓶颈在别处

DeepMind在世界模型方向上有多条并行的研究路线。Hassabis提到的Genie（交互式世界模型）侧重于从文本或图像生成可交互的3D环境，最新的Genie 3可以实时生成720p、24fps的交互世界，用于训练embodied ...

6 天

效果、性能双突破，快手OneSug端到端生成式框架入选AAAI 2026

基于上述问题，快手在业界首次提出端到端的生成式统一查询推荐框架 ——OneSug，成功将召回、粗排、精排等多个阶段统一在一个生成模型中，显著提升了推荐效果与系统效率，在快手电商场景中实现了业务指标与用户体验的双重提升。

InfoQ中国 on MSN

产业级 agent 如何破局? 百度吴健民：通用模型难通吃，垂直场景才是 ...

本文为《2025 年度盘点与趋势洞察》系列内容之一，由 InfoQ 技术编辑组策划。本系列覆盖大模型、Agent、具身智能、AI Native 开发范式、AI 工具链与开发、AI+ ...

5 天

【华龙传媒】周报：GLM-Image国产算力训练落地，多模态开启“认知型 ...

智谱联合华为发布GLM-Image，国产全栈算力底座验证SOTA多模态模型能力。2026年1月14日，新一代图像生成模型GLM-Image正式开源，该模型基于昇腾Atlas 800T ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果