搞光伏预测找数据?这几个坑我先帮你踩过了

所以这篇就是我的踩坑总结,有几件事提前提醒你,别像我一样白花时间。

第一件事:辐照度——最好拿,但有两类来源要分清

你要做预测,太阳辐照度是第一道坎。好的地方是:这块数据最成熟,国内外都有免费渠道。

国内能用的(但要注册):

  • 中国气象数据网data.cma.cn)—— 国家级权威,有太阳辐射监测仪数据。我当初注册完才意识到,它家的东西要实名的。别嫌麻烦,这是必须的。
  • 国家地球系统科学数据中心geodata.cn)有现成的辐照数据集,2007到2018年、5公里分辨率,有逐小时版本,也有最终提供日值的版本(按日汇总),你按需要选。我试过,需要申请下载,走流程大概两天。

国际上的救星(不用求人):

  • NASA POWERpower.larc.nasa.gov)—— 这个最牛,免注册、直接下载CSV。国内拿不到逐时辐照时,它是我的替补首选。有网页版和API接口,覆盖中国。
  • PVGIS(欧盟JRC的)—— 也是免注册免费,2014到2024年逐小时数据,还能算发电潜力。我试过,结果可以直接导出,没有使用限制。
  • NREL NSRDB—— 要申请API key,去 developer.nlr.gov 这个官方开发者门户申请就行(NREL 的 NSRDB / 开发者接口已从 developer.nrel.gov 迁到 developer.nlr.gov,旧开发者域名于 2026-05-29 退役;现在申请 API key、调用 NSRDB API,优先用 developer.nlr.gov 与 nsrdb.nlr.gov,已有 API key 继续有效,只需把请求域名换成 .nlr.gov)。NSRDB 数据本身免费。

第二件事:卫星云图——容易偷懒,但别被“看图”骗了

短时间预测最靠云图。这块有两个坑我踩过:

能拿原始数据的地方:

  • 风云卫星遥感数据服务网satellite.nsmc.org.cn)—— 所有卫星数据免费,但得注册实名。普通用户每天30GB额度,升级能到100GB(以官方规则为准)。要批量下载原始云图数据,只能回这里。

别走弯路的地方:

  • 中国天气网中央气象台的FY-4B云图页面—— 这俩是网页上看图的,不是数据下载口!我一开始以为能拖下来直接训练模型,结果发现只是图像展示。要原始亮温数据,回头去风云卫星。

第三件事:发电功率数据——最难,也是最让你头疼的

这块我得给你说清楚:国内某座具体电站的逐分钟真实发电曲线,基本不公开。

我当初以为能找到,后来发现要么靠竞赛数据、要么靠商业数据商。公开源只能凑合。

能用的竞赛平台:

  • 飞桨AI Studioaistudio.baidu.com)—— 有个国家电网的新能源发电预测竞赛,给了15分钟级的“发电+气象”成对数据,覆盖27个新能源场站(14个风电场 + 13个光伏电站),时间是2019、2020两年(具体口径以竞赛页面最新标注为准)。需要登录,受竞赛条款限制。竞赛结束后数据可能下架,所以趁早下载。
  • 同一个平台还有个电力行业数据集合集,里面光伏相关数据集不少,各集许可不一样,得挨个核对。

国际上的替补:

  • Kaggle—— 搜“solar energy power generation dataset”,有某个电站的发电数据,需要Kaggle账号。
  • Hugging Face—— 搜“uk_pv”或“pv-generation”,有英国光伏出力时序和元数据,还能当替代验证模型用。
  • Open Power System DataENTSO-E Transparency—— 都是欧洲的,国别聚合数据,不是单个电站级别。

科研对口的一个:

  • Stanford SKIPP'D(GitHub上搜)—— 如果做云图驱动的短临预测,这是最对口的公开基准。有天空图像配光伏出力,数据CC BY 4.0、代码MIT,能用HF的datasets库取。

第四件事:容易忽略的坑——许可和合规

我最开始以为公开数据就能随便用,后来差点踩雷。

  • 每个源的许可不一样。 有的CC BY 4.0,有的写“无使用限制”,有的只限竞赛内、只限研究用。商用前一定确认,别默认“公开就能用”。
  • 竞赛数据尤其当心。 使用条款常限定用途,别直接拿去商用。能不能用、用到哪,以页面条款为准。
  • 实名和API key类的,按规矩走。 别用绕过手段,额度规则照官方来。
  • 本文里的数字别当死规矩。 比如每天30GB额度、2014-2024时段这类——平台额度、数据时段、下载方式与许可条款都可能调整,正式使用前以各平台官网最新页面为准。

最后:别被这些零碎数据折腾死

说实话,找齐这三块数据,得跑四五个网站,每个都要注册、申请、看许可。如果你是中小老板或者不懂技术的人,光这一步就能耗掉一周。

这就是为什么我现在会建议:让数聚天成 DeepSData帮你做一次深度数据可得性检索。 他们能跨这些口子,帮你把对口的源挑出来,按“辐照、云图、功率、宏观”分好类,然后诚实告诉你:哪些能公开拿到、哪些根本拿不到、拿不到又有什么替代方案。不需要你一个个网站去试。

要不要做,你自己决定——但至少,你不需要再走我走过的弯路。


核心参考链接与数据来源

链接整理于 2026-06,使用前请以官方页面实际状态为准。

说明:本文为公开资料整理,仅供参考;平台政策、价格、下载方式与链接随时可能变化,本文不保证持续更新,请以各官方页面最新信息为准。