综合异常检测基准:先看 MVTec AD 与 VisA

如果你做的是无监督异常检测(只用良品训练,让模型把任何偏离当作缺陷),这是当前最常用的两个基准。

MVTec AD 是这一方向事实上的标准库,包含 15 个物体与纹理类别、5000 多张高分辨率图像,缺陷区域带像素级标注,覆盖瓶子、电缆、药片、地毯、皮革、金属网格等多种品类。要特别注意它的授权是 CC BY-NC-SA 4.0,明确禁止商用,只能用于学术研究;落地到产品前必须确认这一边界。

VisA(Visual Anomaly) 由 Amazon Science 发布,包含 12 个类别共 10821 张图像(9621 张正常、1200 张异常),涵盖多种 PCB、胶囊、腰果、口香糖等,异常含表面划痕、凹陷、色斑、错位、缺件等结构性与表面性缺陷,提供像素级掩码。它采用 CC BY 4.0,允许商用,是 MVTec AD 之外一个授权更宽松的选择。

钢材与金属表面

NEU 表面缺陷数据库(东北大学)是钢材方向的经典分类数据集,含 1800 张 200×200 灰度图,分裂纹、夹杂、斑块、麻点、氧化铁皮压入、划痕 6 类,每类 300 张,适合做分类与检测基线(后续工作另有目标检测的 NEU-DET 扩展版)。

Severstal 钢材缺陷检测 来自 Kaggle 竞赛,规模更大也更贴近产线:训练集 12568 张 1600×256 灰度图,4 类缺陷,标注以 CSV 中的游程编码(RLE)掩码给出,是做有监督分割的优质数据,需登录 Kaggle 并接受竞赛规则后下载。

KolektorSDD 与升级版 KolektorSDD2 来自斯洛文尼亚 ViCoS 实验室,采集自真实工业环境的金属电子换向器表面:前者 399 张图(52 张含缺陷),后者 3335 张(356 张含缺陷,分训练 / 测试),都提供缺陷标注。两者均为 CC BY-NC-SA 4.0,商用需联系作者。它的正负样本极不平衡,正好用来检验小样本与弱监督方法。

磁瓦表面缺陷数据集(中科院自动化所)收集了气孔、断裂、裂纹、磨损、不均匀等多类磁瓦缺陷,并附像素级标注,可用于分割任务。

通用纹理与光学检测

DAGM 2007(Weakly Supervised Learning for Industrial Optical Inspection)是德国模式识别学会 2007 年竞赛数据,共 10 组人工生成的纹理表面,每组含大量良品与少量缺陷图,弱标签以椭圆形掩码粗略圈出缺陷区。它采用 CC BY 4.0,常用于弱监督缺陷检测研究。

PCB 与电路板

DeepPCB 提供 1500 对图像(每对含一张无缺陷模板与一张对齐的待测图),覆盖开路、短路、鼠咬、毛刺、孔洞、余铜 6 类 PCB 缺陷,标注为带类别的轴对齐边界框,采用 MIT 许可,可直接用于检测训练。VisA 中的 PCB 子集也可作为补充。

织物与纺织

AITEX 织物图像数据库(AFID) 由西班牙 AITEX 纺织研究所发布,含 245 张 4096×256 织物图(140 张无缺陷、105 张含缺陷),覆盖断经、断纬、起球、折痕、结头、污染等 13 类织物缺陷,并附缺陷位置掩码,适合纺织表面检测研究。

选择建议与常见坑

先按你的标注条件选路线:手里只有良品、缺陷形态难以穷举,就走无监督异常检测,优先 MVTec AD(学术)或 VisA(可商用);已有成对的良品 / 缺陷标注、且想精确定位缺陷形状,就走有监督分割,优先 Severstal、KolektorSDD2 这类带像素掩码的数据;只需判断「有无缺陷、属哪一类」,NEU、DeepPCB 这类分类 / 检测数据即可起步。

几个反复出现的坑值得提前留意:一是正负样本极不平衡,缺陷图往往只占百分之几,直接训练容易把模型带偏,要用过采样、难例挖掘或异常检测范式来应对;二是商用授权,MVTec AD、KolektorSDD 系列都是非商用许可,VisA、DeepPCB、DAGM 则相对宽松,产品化前务必逐个核对;三是域差异,公开数据的光照、相机、材质与你自己的产线几乎不可能一致,跨域直接用通常掉点严重,要预留迁移学习或少量真实样本微调的环节。

如果你需要快速判断某个具体材料或工艺下还有哪些可用数据、或某个数据集是否已迁移失效,可以试试数聚天成的数据集检索服务。我们用学术诚实的框架做检索,命中就如实返回、没有就直说,帮你少花时间在失效链接上,把精力留给真正的建模工作。