糖尿病眼底数据去哪搞?直接上干货,先码住再说
但别高兴太早——糖网数据不在一处,它散落在七八个平台上,每个的规矩都不一样:有的要注册、有的要申请、有的国内连不上。一个一个试,时间全搭进去。
下面直接给你能用的、能打开的、国内能下的真实来源。标了🌟的优先看。
🥇 优先看这两个,国内最省心
1. DDR(南开大学,国产,带百度网盘)
- 链接:https://github.com/nkicsl/DDR-dataset
- 有什么:13673张彩色眼底图,来自全国23省147家医院(2016–2018年)。有国际分级标签,其中757张还带病灶像素级圈定(微动脉瘤、渗出、出血都给你框好了)。
- 怎么拿:GitHub项目页里直接给了百度网盘 + 谷歌网盘两条路。有百度盘,国内下载一马平川。
- 备选:Hugging Face上也有转存,约1万张:https://huggingface.co/datasets/ctmedtech/DDR-dataset(但以GitHub官方LICENSE为准)
- 注意:有LICENSE文件,告诉你授权范围。
2. IDRiD(印度糖网影像集,开放获取,标注最细)
- 正本链接:https://ieee-dataport.org/open-access/indian-diabetic-retinopathy-image-dataset-idrid
- 有什么:516张,但标注极细——带像素级病灶掩膜(微动脉瘤、硬渗、软渗、出血)、视盘掩膜、分级、定位。ISBI-2018挑战赛数据。
- 怎么拿:IEEE DataPort 上为开放获取,通常不需要付费订阅;是否需要注册/登录、具体下载方式以 IEEE DataPort 页面为准。
- 备选:Zenodo镜像:https://zenodo.org/records/17219542;官方数据说明页:https://idrid.grand-challenge.org/Data/
🥈 体量大但需要Kaggle账号
3. APTOS 2019(亚太远程眼科学会竞赛)
- 链接:https://www.kaggle.com/c/aptos2019-blindness-detection/data
- 有什么:3662张训练 + 1928张测试,5级分级(0–4),数据来自印度Aravind医院。
- 怎么拿:必须登录Kaggle账号,接受竞赛规则,不是匿名直链。会用命令行的可以:
kaggle competitions download -c aptos2019-blindness-detection - 备选(绕开Kaggle登录):Academic Torrents有种子镜像:https://academictorrents.com/details/d8653db45e7f111dc2c1b595bdac7ccf695efcfd
4. EyePACS(体量最大,35000+张)
- 链接:https://www.kaggle.com/c/diabetic-retinopathy-detection/data
- 有什么:约35126张,0–4级分级,常用作大规模训练基础集。
- 怎么拿:同样要Kaggle账号+接受规则。
- 备选(下载方便但许可存疑):Hugging Face第三方转存:https://huggingface.co/datasets/bumbledeep/eyepacs——许可以原始Kaggle页为准,第三方说不清。
- 程序化路径:如果用TensorFlow,这个集被封装进TFDS,直接代码加载:https://www.tensorflow.org/datasets/catalog/diabetic_retinopathy_detection
🥉 需要注册,但值得拿
5. Messidor / Messidor-2(法国TECHNO-VISION)
- 链接:https://www.adcis.net/en/third-party/messidor/
- 有什么:Messidor原集1200张(TIFF格式,1440×960分辨率),含糖网分级+黄斑水肿风险;Messidor-2专攻糖网,1748张。
- 怎么拿:在ADCIS官网,先注册并同意使用条款才能下载。
💡 几个实用提醒
- 许可先确认清楚:医学影像集大多只限学术研究,禁止商用。每个集的LICENSE或使用条款都不同,用之前一定回到官方链接看明白,别默认“能下载就能用”。
- 别走CSDN/知乎的网盘链接:那些二次上传的,既不保证真实有效,还可能违反原集“禁止再分发”条款。优先走官方正本,版权上才稳妥。
- 数字当概数看:上面写的张数,以你实际下载到的版本为准。
🚨 一个现实:数据散,规矩多
真正麻烦的,不是“有没有”,而是它散在Kaggle、IEEE DataPort、ADCIS、南开GitHub、Hugging Face、Zenodo……每个的来源、登录、商用、国内能不能直连都不一样。自己一个一个试,真能撞一整天墙。
不想自己挨个试?
可以找数聚天成 DeepSData帮你做一次深度数据可得性检索:把你具体要干嘛告诉我们,我们把糖网眼底这些零散来源统一扫一遍,整理成一张表,挨个标清楚——免费直下还是得注册?要不要Kaggle账号?能不能商用?国内有没有镜像?快不快?最关键的是,给你一句老实的判断:到底能不能拿到。哪些匿名直下、哪些要申请、哪些只限学术、哪些国内慢有替代网盘,全如实写。找不到对口的,也会直说,绝不瞎保证。需要的话随时找我们,不强求。
本文仅作公开来源整理和可得性参考,不构成医疗、法律、投资、商业决策或合规意见;正式使用前请以官方页面、授权条款和专业意见为准。
说明:本文为公开资料整理,仅供参考;平台政策、价格、下载方式与链接随时可能变化,本文不保证持续更新,请以各官方页面最新信息为准。
参考来源
- https://www.kaggle.com/c/aptos2019-blindness-detection/data
- https://academictorrents.com/details/d8653db45e7f111dc2c1b595bdac7ccf695efcfd
- https://www.kaggle.com/c/diabetic-retinopathy-detection/data
- https://huggingface.co/datasets/bumbledeep/eyepacs
- https://github.com/nkicsl/DDR-dataset
- https://huggingface.co/datasets/ctmedtech/DDR-dataset
- https://ieee-dataport.org/open-access/indian-diabetic-retinopathy-image-dataset-idrid
- https://zenodo.org/records/17219542
- https://idrid.grand-challenge.org/Data/
- https://www.adcis.net/en/third-party/messidor/
- https://www.tensorflow.org/datasets/catalog/diabetic_retinopathy_detection
