技术只有变得足够“便宜”,才能实现真正“普及”,从而深度融入到工作与生活的方方面面。 所以,当GLM-Image在API调用模式下生成一张图片只需0.1元时,价格仅为海外同类产品的1/10至1/3,全球AI市场都为之震撼。
下图展示了一个有趣的现象:在法国斗牛犬的图像上添加一小块对抗性补丁后,VGG分类器竟然以极高的置信度将其判定为足球。Grad-CAM可视化清楚地显示,模型的注意力完全从狗身上转移到了那块补丁——一个精心构造的小扰动就足以劫持整个决策过程。
在AI图像生成领域,2025年末迎来了一场技术地震。谷歌推出的Nano Banana Pro(官方名Gemini 3 Pro Image)不仅是一次版本迭代,更是从根本上重新定义了AI视觉生成的边界与可能性。这款基于Gemini 3 Pro架构构建的模型,实现了从“感性艺术创作”到“理性视觉工程”的范式跃迁,将大型语言模型的“思维链”机制深度植入了图像生成的底层逻辑中。 与传统AI绘图模型相比,N ...
在AI图像生成领域,2025年末迎来了一场技术地震。谷歌推出的Nano Banana Pro(官方名Gemini 3 Pro Image)不仅是一次版本迭代,更是从根本上重新定义了AI视觉生成的边界与可能性。这款基于Gemini 3 ...
为模拟真实编辑场景并系统评估学术海报自动编辑能力,团队通过参考导向与无参考优化两种方式构建了首个学术海报编辑基准测试APEX-Bench,该基准覆盖 59 篇 ICLR、ICML、NeurIPS 顶级会议论文,对应514条具有4种难度梯度的编辑指令,涵盖文本内容修改、风格调整、图像编辑与布局重构等多种操作类型。
一年以前,Stability AI还曾是一家文生图领域的超级明星:当Stable ...