你这个问法太对了。搞轴承的PHM(说白了就是“给轴承做体检”——看它啥时候坏,还能扛多久),数据确实是个绕不开的坎。好消息是:这玩意儿在工业大数据里,算是最“成熟”的一块了,公开数据集多得很,基本不存在“彻底找不到”的悲剧。但你真正要操心的,反而是另外三件事:原站打不开、网上的版本被人改过、还有商用许可含含糊糊。
下面我给你把路数讲透,就照着这些地方找,错不了。
首先,是几个“教科书级”的宝贝
这些是全世界搞这个的人入门的必刷数据集,就像学编程的“Hello World”。
- 美国凯斯西储大学(CWRU)的轴承数据中心:这个是最最经典的,几乎所有教程和论文开头都用它。你直接去它官网:https://engineering.case.edu/bearingdatacenter。然后在页面上找“Download Data File”(下载地址:https://engineering.case.edu/bearingdatacenter/download-data-file)。里面是MATLAB的.mat文件,有振动信号和转速。要小心的是:这网站偶尔访问慢,而且官方没说清能不能商用,按规矩只能学术研究用。
- 德国帕德博恩大学(Paderborn)的KAt数据中心:这个更高级,它不光有振动信号,还有电机电流信号。去它官网:https://mb.uni-paderborn.de/en/kat/research/bearing-datacenter,然后点“Data-sets-and-download”(https://mb.uni-paderborn.de/en/kat/research/bearing-datacenter/data-sets-and-download)。里面有32种轴承状态,既有故意弄坏的,也有自然老化的,质量很高。注意:下载前得在官网接受使用条款,一般也要求引用论文。
- NASA和竞赛数据(做寿命预测的)
- PHM 2012挑战赛数据集(FEMTO-ST):这是做“还能用多久”这个问题的经典数据集。原网站早就打不开了,你直接去GitHub这个镜像下:https://github.com/Lucky-Loek/ieee-phm-2012-data-challenge-dataset,是CSV格式的,很友好。
- NASA的IMS轴承数据集:这也是全寿命到失效的经典。它的官方发布源在NASA网站:https://www.nasa.gov/intelligent-systems-division/discovery-and-systems-health/pcoe/pcoe-data-set-repository/。如果这个站不稳,可以去PHM Society的镜像:https://data.phmsociety.org/nasa/。整包大概6个G,比较大。
其次,是咱们国产的、访问快的
- 西安交大+昇阳科技的XJTU-SY数据集:做剩余寿命预测的国产首选。官方解读可以看这篇论文:https://www.jgcm.ac.cn/cn/article/id/jxgcxb-529。数据本身经常通过百度网盘发布,注意网盘限速和分卷下载的麻烦。
- 江南大学轴承数据集(JNU):适合做不同转速下的诊断。你去这个中文聚合站就能下:http://www.52phm.cn/datasets/bear/Bearing-data-set-of-Jiangnan-University.html,国内直接访问,很顺畅。
最后,是一堆“找不着原站”时的好备胎
这些地方就像一个数据大杂烩,你找不到原版或者原版打不开的时候,先去这碰碰运气。
- 中文聚合站(52phm.cn):大部分数据都能在这找到导航,尤其适合国内用户:http://www.52phm.cn/datasets/。
- 百度飞桨AI Studio:上面有现成的轴承故障诊断项目,直接挂着数据集,还能在线跑代码:https://aistudio.baidu.com/aistudio/projectdetail/5734496。
- GitHub合集:搜“awesome-bearing-dataset”(https://github.com/VictorBauler/awesome-bearing-dataset),或者“hustcxl/Rotating-machine-fault-data-set”(https://github.com/hustcxl/Rotating-machine-fault-data-set),这两个合集都给你列得清清楚楚。
- Kaggle和Zenodo:Kaggle上有人整理了CWRU的版本(https://www.kaggle.com/datasets/brjapon/cwru-bearing-datasets),Zenodo上有带DOI的正式存档版(https://zenodo.org/records/10987113)。但千万注意:这些基本都是别人再加工过的二手版,做正经研究回原版。
说句掏心窝子的话:
你看,这些数据散落在“美国大学官网、NASA仓库、德国实验室、国内百度网盘、各种GitHub镜像”这五六个彼此不通的地方。你要一个个翻,还得分辨哪个是原始版、哪个是二手版、哪个到底能不能商用,确实费老劲了。
如果你不想自己一处处去撞墙、去核实那些“到底能不能用”的许可条款,我们可以帮你做一次深度数据可得性检索。就是把你想找的数据,按“全寿命预测还是故障分类”“国内好不好下载”“只有振动数据还是带电流数据”这些要求分好类,给你配上“官方站+稳定镜像”两条路,并且老老实实告诉你,这个数据你到底能不能拿到,能不能用在你自己的商业产品里。
这事儿我们自己干费时间,但你要是觉得值,随时找我们聊聊。
说明:本文为公开资料整理,仅供参考;平台政策、价格、下载方式与链接随时可能变化,本文不保证持续更新,请以各官方页面最新信息为准。
参考来源
- https://engineering.case.edu/bearingdatacenter
- https://engineering.case.edu/bearingdatacenter/download-data-file
- https://zhuanlan.zhihu.com/p/88938034
- https://www.jgcm.ac.cn/cn/article/id/jxgcxb-529
- https://github.com/Lucky-Loek/ieee-phm-2012-data-challenge-dataset
- https://www.nasa.gov/intelligent-systems-division/discovery-and-systems-health/pcoe/pcoe-data-set-repository/
- https://data.phmsociety.org/nasa/
- https://mb.uni-paderborn.de/en/kat/research/bearing-datacenter
- https://mb.uni-paderborn.de/en/kat/research/bearing-datacenter/data-sets-and-download
- https://www.mfpt.org/fault-data-sets/
- http://www.52phm.cn/datasets/
- http://www.52phm.cn/datasets/bear/Bearing-data-set-of-Jiangnan-University.html
- http://www.52phm.cn/datasets/bear/Bearing-competition-data-set.html
- https://aistudio.baidu.com/aistudio/projectdetail/5734496
- https://github.com/VictorBauler/awesome-bearing-dataset
- https://github.com/jonathanwvd/awesome-industrial-datasets/blob/master/markdown/paderborn_university_bearing_dataset.md
- https://github.com/hustcxl/Rotating-machine-fault-data-set
- https://www.kaggle.com/datasets/brjapon/cwru-bearing-datasets
- https://zenodo.org/records/10987113
