在覆盖事实知识、复杂推理、指令遵循、人类偏好对齐以及 Agent 能力等 19 项主流评测基准中,Qwen3-Max-Thinking 取得多项领先成绩,刷新了多项最佳纪录,其综合表现已进入与 ...