先说结论:气象数据确实不难找,但想“干净利落”拿到手,比想象中费劲得多。真不是有没有的问题,是“散得像天女散花,门槛五花八门,有的还要实名+排队+会编程”。
先给你划分清楚,别搞混了:气象数据分两种,一种是观测站点数据(就是气象站实测的,比如你家门口那个站的温度、降雨,算是点状的),另一种是再分析格点数据(把卫星、模型、观测算出来的整个地图的网格,像给地球铺了张毯子)。你要哪个,直接决定了去哪个源。别问为啥我这么熟,因为一开始我也搞混了,白忙活半天。
一、国内官方源:权威,但门难进
中国气象数据网 (data.cma.cn)
这玩意儿是国内最权威的源,没毛病。但你得注册,还分普通、个人实名、机构实名、教育科研实名……级别不同,你能看的东西和能下的量差老远了。
- 链接:https://data.cma.cn/
- 坑:教育科研实名用户(就是你这种小老板大概率不是),单日下载额度才12MB左右(以官方为准)。这意味着啥?大概够你下全国站点一个月的原始数据。你想下1年的?那得连着下12天,天天去盯着,不然就断。而且这级要求你是公益机构在职人员,学生得找导师出面——个人散户想搞全量数据?就别折腾了。
国家青藏高原科学数据中心 (data.tpdc.ac.cn)
这地方不错,有2500多个数据集,大气、冰冻圈都有。关键它镜像发布了一个好东西——中国地面气候资料日值数据集 V3.0,1951年至今,699个站的日值气温、降水、风速都有。
- 链接:https://data.tpdc.ac.cn/
- 坑:不是点下就下的。得注册→填申请理由→等审批→创建FTP下载。流程麻烦,但确实能拿到。
国家地球系统科学数据中心 (www.geodata.cn)
类似青藏高原中心,也是国家平台,多学科数据都有。注册登录后申请,也是走FTP下载,门槛一样。
风云卫星遥感数据服务网 (satellite.nsmc.org.cn)
搞卫星数据的官方门户,有使用帮助。也是要注册。
- 链接:https://satellite.nsmc.org.cn/DataPortal/cn/support/faq.html
总结国内源:最权威,但如果你不是体制内搞科研的,要么额度卡死,要么审批流程长,要么格式不友好。个人散户想省事?难。
二、国际权威源:全球覆盖,但格式硬骨头
Copernicus CDS - ERA5(全球科研标配)
这玩意儿是欧洲中期天气预报中心的再分析数据,1940年至今逐小时,31公里网格,变量多得吓人。另一版ERA5-Land有9公里网格,更精细。
- 链接:https://cds.climate.copernicus.eu/datasets/reanalysis-era5-single-levels?tab=download
- 坑:免费但要注册。网页上能下小批量,想下完整数据?必须用CDS API写代码(得会点Python)。原始格式是NetCDF或GRIB,非技术用户打开就是一堆乱码。国内访问网络偶尔抽风,下载速度感人。
NOAA NCEI - GHCNd(站点观测的金标准)
180多个国家,10万多个站点的逐日观测数据(最高最低温、降雨、雪深等)。全球最权威的地面观测数据集之一。
- 链接:https://www.ncei.noaa.gov/products/land-based-station/global-historical-climatology-network-daily
- 好拿:免费,无须复杂申请。原始是ASCII文本,也能选站点导CSV。另外在AWS、Google BigQuery、Kaggle都有备份,方便搞编程的哥们。
NASA POWER API
面向农业、建筑、可再生能源的,全球太阳辐射+气象数据,1984年起有。
- 链接:https://power.larc.nasa.gov/api/pages/
- 好拿:有网页版可视化工具(Data Access Viewer),也有逐日/逐月/逐时的REST API,适合批量取数,免费。
World Bank 气候变化知识门户 (CCKP)
主要给气候变化研究用的,CMIP6气候投影数据,0.25度网格,1950-2100,含不同排放情景。
- 链接:https://climateknowledgeportal.worldbank.org/download-data
- 好拿:Public许可,网页可下,也有API和AWS镜像。
总结国际源:数据全、免费、许可松,但对非技术用户不友好,基本都得搞NetCDF/GRIB,还得会点命令行或脚本。
三、社区/竞赛平台:门槛低,但别当真用
百度飞桨AI Studio (aistudio.baidu.com/datasetoverview)
里面有上千个开放数据集,搜“天气”能找到一些,比如有个叫“Weather”的数据集(datasetdetail/13165)。但这些都是用户传的,质量、范围、时间切片都很随机(比如只有印度、只有2012-2017),千万别当权威源用于正式项目,只适合快速试验。
Hugging Face (huggingface.co/datasets/notadib/NASA-Power-Daily-Weather)
有人把NASA POWER数据整理成了现成数据集(1984-2022,覆盖美洲5x8网格)。分析就绪,方便用,但记住这是社区整理版,不是官方源。
Kaggle (kaggle.com/datasets/selfishgene/historical-hourly-weather-data)
有历史逐小时天气CSV(2012-2017,城市切片),适合练手。还有每日更新的全球天气数据集(kaggle.com/datasets/nelgiriyewithana/global-weather-repository)。
- 注意:都需要Kaggle账号,数据授权五花八门,用的时候一定回去看原始页面说明。
踩坑总结 & 找数据的真实“退路”
好拿的:国际的NOAA GHCN、NASA POWER、World Bank CCKP,基本注册就能下。社区平台更快,注册即下。
真坑(提前知道能哭):
- 中国气象数据网有下载额度:12MB/天(以官方为准),大数据量得费老大劲。
- 国内官方数据源基本不是即点即下:青藏、地球系统这些,都得填申请走FTP,审批流程慢。
- ERA5网页有下载排队:大数据量必须学CDS API,格式NetCDF/GRIB,非技术劝退。
- 国际源格式硬:ASCII定宽、NetCDF、GRIB,得用脚本或专业工具才能解析。部分还得科学上网(以实际网络为准)。
- 社区平台数据质量参差不齐:时间范围、区域、授权说明都靠你自己读,别当权威源用。
要是真找不到、嫌麻烦怎么办?
我之前就是这么过来的。明明知道“中国地面气候资料日值数据集V3.0”这东西在好几个地方都有(中国气象数据网、青藏数据中心),但要么额度卡死,要么申请流程慢,要么格式搞不定。绕了一圈,最后还是找人帮忙。
如果你也遇到这种情况,别自己硬抗。找数据这事儿,很多源看起来有,但实际拿不拿得到、要什么条件、格式你能不能搞定,得一个个试。我们数聚天成 DeepSData就是干这个的——做数据可得性深度检索。你把你需要的区域、时间、要素扔过来,我们帮你把官方源、再分析源、社区镜像逐个比对,诚实地告诉你到底哪个源真有你要的数据,是站点数据还是格点数据,什么格式,要不要实名、有没有额度、要不要科学上网。不吹牛能找到一切,但帮你省下你自己一个一个试的时间,这活儿我们拿手。需要时找我们就行。
说明:本文为公开资料整理,仅供参考;平台政策、价格、下载方式与链接随时可能变化,本文不保证持续更新,请以各官方页面最新信息为准。
参考来源
- https://data.cma.cn/
- https://data.cma.cn/user/register/shareLevel/4.html
- https://data.tpdc.ac.cn/
- https://www.geodata.cn/
- https://satellite.nsmc.org.cn/DataPortal/cn/support/faq.html
- https://cds.climate.copernicus.eu/datasets/reanalysis-era5-single-levels?tab=download
- https://www.ncei.noaa.gov/products/land-based-station/global-historical-climatology-network-daily
- https://power.larc.nasa.gov/api/pages/
- https://climateknowledgeportal.worldbank.org/download-data
- https://aistudio.baidu.com/datasetoverview
- https://huggingface.co/datasets/notadib/NASA-Power-Daily-Weather
- https://www.kaggle.com/datasets/selfishgene/historical-hourly-weather-data
- https://www.kaggle.com/datasets/nelgiriyewithana/global-weather-repository
- https://registry.opendata.aws/noaa-ghcn/
