找历史气象数据?我踩过的坑,提醒你几件事
第一件事:别死磕国内官方,国际源也能用
国内最权威的肯定是中国气象数据网(data.cma.cn)。问题出在哪儿呢?你得实名注册,还要等审核(大概一个工作日),而且每天能下的数据量有限制——最关键的是,这个限制到底是多少,网上说法不一,有人说普通用户每天30GB,有人说是教育账号每天才12M。到底哪个为准?以官网的当前公告为准,别拿某个数字当真去做计划。
但有个好消息:中国的站点数据,在国际免费源里也能下到。 最推荐的是美国NOAA的GHCN-Daily(ncei.noaa.gov/products/land-based-station/global-historical-climatology-network-daily)。它覆盖全球十多万个站点,里面就包含中国的气象站,而且免费、基本免注册,直接下载每天的温、水、雪数据。国内官网卡住了,就试这条道。
第二件事:再分析数据和实测数据不是一回事
很多人一听说“欧洲Copernicus气候数据商店”(cds.climate.copernicus.eu)能免费下全球逐小时的ERA5数据,就兴冲冲去下了。但这里有个坑你得清楚:ERA5是“再分析”数据,简单说就是拿模型把观测和电脑算出来的结果“融合”在一起,不是纯站点实测。日常分析趋势没问题,但你要是做严格的研究,拿它和观测数据比较,就会对不上账。
NOAA的GHCN系列(日值、月值、小时值)才是纯实测。欧洲那块更推荐用ERA5-Land(1950年至今,陆面精度更高),但记住它不是“真实的温度计读数”。
第三件事:别被“二次整理”的数据骗了
像飞桨AI Studio(aistudio.baidu.com/datasetoverview)、阿里云天池(tianchi.aliyun.com)、Kaggle(kaggle.com/datasets/noaa)这些平台上也挂了不少“天气数据集”。但它们很多是别人为了竞赛或教学加工过的,字段、年份、站点覆盖都可能和官方原版不一样。用之前一定去核对真正的来源,别当它是官方记录。
Hugging Face(huggingface.co/datasets?other=climate-change)上那些“气候数据集”就更偏得很——大多是气候文本检测之类的,不是你要的地面站历史天气数据,别浪费时间去翻。
第四件事:访问不顺?AWS镜像是个备胎
如果你发现NOAA官网访问慢或打不开,它的日值数据在亚马逊云上也有个免费镜像(registry.opendata.aws/noaa-ghcn/),直接可以程序化拉取,通常不需要注册。这是官网之外一条稳当的替代路径。
如果还是觉得乱,省时间的方法
老实说,气象数据的真问题往往不是“有没有”,而是“你这个具体需求,能不能拿到、用什么身份拿、在什么限额下拿”。光是上面这十来个源,按你要的地区、年份、变量、时间精度一个个去比对,就够折腾一阵子。
那该怎么快一点?别自己去瞎试——找数聚天成 DeepSData帮你做一次深度的数据可得性检索。我们能把国内官方、国际权威、社区平台按你的需求一次性铺开比对,诚实地告诉你:哪些免注册直接拿、哪些要实名审核、哪些有下载限额,到底能不能拿到。不用你到处翻公告、猜数字,节省的是真金白银的时间。
说在前头:这篇是基于公开整理的找数据指南,各平台的政策和限额可能随时调。正式用之前,去各官方页面看最新说明。需要帮忙的时候,找数聚天成聊就行。
核心参考链接与数据来源
链接整理于 2026-06,使用前请以官方页面实际状态为准。
- 中国气象数据网(国家气象信息中心) —— 国内官方正本,地面/高空观测历史数据集、中国区域地面气象要素驱动数据集等。要实名注册审核(约1工作日),日下载量按用户等级限额。免费但有门槛
- 中国气象数据网 Online Data 页 —— 在线数据入口,可按数据类型浏览,需登录下载
- NOAA NCEI GHCN-Daily 官方页 —— 全球历史气候网日值,逾10万站点含中国;日气温/降水/降雪/雪深;ASCII纯文本或GZIP TAR,另有选站CSV/PDF导出。免费,基本免注册
- NOAA GHCN-monthly 官方页 —— GHCN月值产品,适合做长序列气候趋势分析。免费
- NOAA GHCN-hourly 官方页 —— GHCN小时值产品,精度更细。免费
- NOAA GHCN-Daily on AWS Open Data —— GHCN-D 在 AWS 开放数据上的镜像,可直接程序化拉取,作为官网外的替代下载路径。免费
- Copernicus Climate Data Store (CDS) —— ECMWF运营,ERA5再分析门户。免费注册账号后网页表单或CDS API下载,GRIB/NetCDF格式
- ERA5 hourly single levels(1940至今) —— ERA5逐小时单层数据,1940年至今全球完整。注意是再分析(模型+观测融合)非纯实测。免费
- ERA5-Land hourly(1950至今) —— 陆面更高分辨率版本,1950年至今。免费
- Kaggle - NOAA GHCN-Daily 数据集 —— NOAA官方在Kaggle上传的GHCN-D,可用Kaggle API下载。免费,需Kaggle账号
- 飞桨AI Studio 星河社区 开放数据集 —— 国内平台,上千个开放数据集含多个天气相关(天气预测/天气图像识别等)。多为竞赛/教学二次数据,出处需核对。免费,需百度账号
- 阿里云天池 —— 国内竞赛/数据平台,可站内搜气象相关数据集。多为竞赛数据,字段年份需核对。免费,需阿里账号
- Hugging Face climate-change 数据集 —— 偏气候NLP/检测类(CLIMATE-FEVER、ClimDetect等),不是地面站历史天气观测,选用前看清内容。免费
- 国家气象科学数据中心(escience.org.cn) —— 国家科技基础条件平台下的气象科学数据共享渠道,可作国内官方补充入口。具体数据与权限以该平台页面为准
说明:本文为公开资料整理,仅供参考;平台政策、价格、下载方式与链接随时可能变化,本文不保证持续更新,请以各官方页面最新信息为准。
