一、全球高分辨率栅格产品(10米级,适合大范围制图)
这一档是“拿来即用”的成图产品,每个像元已经被分好类,适合区域或全球尺度的土地覆盖制图、变化监测。
- ESA WorldCover:欧空局出品,全球 10 米分辨率,11 个类别(含林地、灌木、草地、耕地、建成区、裸地、雪冰、水体、湿地、红树林、苔藓地衣),提供 2020 和 2021 两个年份。数据为云优化 GeoTIFF(COG),可通过官方 viewer、Terrascope、AWS S3 公开桶、Zenodo 多种方式免费下载,采用 CC BY 4.0 授权。注意官方提示:两期之间的差异既有真实地表变化,也有算法版本差异,做变化分析时要留意。
- Esri / Impact Observatory 10米年度土地覆盖:基于 Sentinel-2、由 Impact Observatory 用数十亿人工标注像元训练生成,全球 10 米,9 个类别,年份覆盖 2017 年至最近一期,适合做多年时间序列对比。可在 Esri 土地覆盖浏览器交互查看并按区域/年份下载,也能在 Google Earth Engine 中调用。
- Google Dynamic World V1:谷歌与世界资源研究所(WRI)合作,全球 10 米、近实时更新,9 个类别,时间从 2015-06-27 至今。它的特点是同时给出每个类别的概率值而不仅是硬标签,适合做不确定性分析。数据托管在 Google Earth Engine,通过 Earth Engine API(JS 或 Python)调用,需注册账号。
二、全球中分辨率产品(30米级,覆盖更长历史)
如果你做的是历史回溯或更大尺度的统计,10 米数据体量太大,30 米更合适。
- GlobeLand30:中国国家基础地理信息中心(NGCC)研制,全球首套 30 米分辨率全球地表覆盖数据,10 个类别(耕地、森林、草地、灌木、湿地、水体、苔原、人造地表、裸地、冰川积雪),提供 2000、2010 等基准年。用于科研和公益用途免费,需在官方门户注册申请。该 UN-SPIDER 页面给出了数据说明与官方申请入口,具体年份与指标以官方页面为准。
三、带标签的场景分类样本集(适合训练分类模型)
这一档不是成图产品,而是已经切好、打好标签的小图块,专门用于训练和评测影像分类网络。
- EuroSAT:基于 Sentinel-2,10 个 LULC 类别、共 27000 张地理参考图块,每张 64×64 像素。提供 RGB 版(EuroSAT_RGB.zip)和包含全部 13 个波段的多光谱版(EuroSAT_MS.zip),MIT 授权,入门和基准测试都很常用。
- NWPU-RESISC45:西北工业大学制作,45 个场景类别、每类 700 张、共 31500 张,统一 256×256 像素,来源于 Google Earth,空间分辨率从约 0.2 米到 30 米不等。类别多、跨分辨率,是场景分类的重量级基准。
- UC Merced Land Use:经典的小型基准,21 个土地利用类别、每类 100 张、共 2100 张,多数为 256×256 像素,源自 USGS 航空影像,空间分辨率约 0.3 米(公有领域)。体量小、上手快,适合做方法验证。
- AID(Aerial Image Dataset):武汉大学制作,30 个航拍场景类别、共约 10000 张、每张 600×600 像素,取自 Google Earth,分辨率约 0.5 米到 8 米不等。类内样本量不均(每类约 200–400 张),更贴近真实复杂场景。
- BigEarthNet v2.0:柏林工业大学制作的大规模基准,包含 549488 对 Sentinel-1/Sentinel-2 图块,多标签标注来自 2018 年 CORINE 土地覆盖库,覆盖欧洲 10 国,并新增了像元级参考图。适合做多标签分类、多模态和自监督预训练,但总量超过 100GB,要预留存储和下载时间。
四、怎么选,以及常见的坑
做大范围制图、变化监测,优先用第一、二档的全球栅格产品(WorldCover、Esri、Dynamic World、GlobeLand30);做小样本训练、方法验证或刷基准,用第三档的标签样本集(UC Merced 入门、EuroSAT/RESISC45/AID 进阶、BigEarthNet 上规模)。
几个一定要先确认的点:
- 类别体系不一致:WorldCover 11 类、Dynamic World 9 类、GlobeLand30 10 类,类别定义和粒度都不同,跨产品对比前必须先做类别映射,否则结论会失真。
- 年份与算法版本:同一产品不同年份可能换了算法(WorldCover 已明确提示),变化检测时要区分“真实变化”和“算法差异”。
- 投影与坐标系:栅格产品多为 EPSG:4326 或 UTM 分幅,拼接、叠加前先统一投影。
- 商用授权:科研免费不等于可商用。GlobeLand30 限科研/公益,EuroSAT 为 MIT、BigEarthNet 为 CDLA-Permissive,商用前请逐一核对各自许可证。
如果你不确定哪套数据的类别体系、分辨率和授权最匹配你的任务,或者想快速判断某个公开数据集是否真的覆盖你的研究区,可以借助数聚天成的数据集检索服务做一次结构化比对。我们坚持学术诚实:检索只告诉你“有什么、在哪取、限制是什么”,最终能否满足你的需求,仍以各数据源官方页面为准。
参考来源
- https://esa-worldcover.org/en/data-access
- https://gee-community-catalog.org/projects/S2TSLULC/
- https://livingatlas.arcgis.com/landcoverexplorer/
- https://developers.google.com/earth-engine/datasets/catalog/GOOGLE_DYNAMICWORLD_V1
- https://www.un-spider.org/links-and-resources/data-sources/land-cover-map-globeland-30-ngcc
- https://github.com/phelber/EuroSAT
- https://zenodo.org/records/7711810
- https://huggingface.co/datasets/timm/resisc45
- https://www.tensorflow.org/datasets/catalog/uc_merced
- https://captain-whu.github.io/AID/
- https://zenodo.org/records/10891137
