最近,在计算机视觉领域,一个简单却有力的观点正悄然兴起:我们真的需要复杂的视觉-语言大模型来解决一切问题吗?尤其是在工业质检、医疗影像分析等高度依赖视觉信息的异常检测(Anomaly Detection, AD)任务上。