专利数据去哪找?先码住这篇,省得自己乱翻

这篇就是给你列个清单,哪些地方能免费看,哪些地方要花钱,哪些地方是专给搞科研/搞AI用的。先收藏,以后用得上。


一、国内官方免费渠道(先从这里开始)

  • 国家知识产权局 · 专利检索及分析系统

https://pss-system.cponline.cnipa.gov.cn/

官方免费。注册后能查、能下中国专利,还收录了100多个国家的数据。查国内专利,这是最稳的起点。

  • 中国专利公布公告(国家知识产权局)

http://epub.cnipa.gov.cn/

官方免费。查中国专利的公开、授权公告原始信息,跟上面的系统不是一回事,这个更偏向“公告”。

  • 国家知识产权公共服务平台

https://ggfw.cnipa.gov.cn/

官方平台。里面有《知识产权数据使用手册及开放目录》,想搞清楚官方到底开放了哪些数据,从这里看。

  • 国家知识产权局官网 · 数据栏目

https://www.cnipa.gov.cn/col/col61/index.html

官方的宏观专利统计、年报啥的,做行业概览用,具体口径以页面为准。


二、做学术研究用的“整理好的”面板数据(多要钱或机构订阅)

  • CnOpenData

https://www.cnopendata.com/

经管研究常用。包含中国专利全量申请授权、专利引用、绿色专利、A股上市公司专利等,号称14亿+条。一般是订阅或按数据集购买,别想着能免费全量拿走。

  • 国泰安 CSMAR

https://www.gtarsc.com/

也有专利子库,字段很全(申请日、授权公告日、发明人、被引次数等),覆盖1985年至今。高校多用机构订阅,个人难免费拿全量,具体看你学校有没有买。


三、国际权威免费渠道(查全球/PCT专利)

  • WIPO PATENTSCOPE(世界知识产权组织)

https://patentscope.wipo.int/search/zh/search.jsf

官方免费。收录约1.238亿件专利文献(含520万件PCT申请),覆盖70多个专利局。基础检索免注册,免费账户可保存检索、设置提醒。注意:每次最多导出1万条到Excel,适合查、不适合一次全搬。

顺便一提: 欧洲专利局的Espacenet、Google Patents,和PATENTSCOPE并称“三大免费检索”,都能免费看。


四、给AI/批量分析/数据建模用的(需要点技术)

  • Google Patents Public Datasets(托管在BigQuery)

https://github.com/google/patents-public-data

谷歌公开的专利数据集,在BigQuery上,会写SQL就能查,成本低,不用整包下载。Kaggle上也有镜像(kaggle.com/datasets/bigquery/patents)。

  • PatentsView 数据下载(美国专利局USPTO)

https://patentsview.org/downloads/data-downloads

免费CSV和批量表,覆盖美国1976年至今,还把同名发明人/机构区分开了(叫“消歧”)。重要提醒:官方说2026年3月20日会迁移到data.uspto.gov,旧入口可能没法用,用之前去官网确认。

  • USPTO 批量数据下载

https://www.google.com/googlebooks/uspto.html

美国专利商标局的批量数据(Google托管的下载入口),全文/著录都能下。免费,但文件很大。

  • 哈佛USPTO专利数据集 HUPD

https://patentdataset.org/

专门给机器学习用的语料。2004–2018年约450万件美国专利申请,34个字段。公开可下,在Hugging Face和GitHub上都有(具体链接见上)。

  • OECD 知识产权统计

https://www.oecd.org/sti/inno/intellectual-property-statistics-and-analysis.htm

含按地区(REGPAT)、引用(Citations)、三方专利家族等指标库。大多填表申请后可免费获取,以官方答复为准。


五、最权威的统计大库(要花钱)

  • EPO PATSTAT(世界专利统计数据库)

https://www.epo.org/en/searching-for-patents/business/patstat

统计研究最权威的大库,约9000万条。付费(大约1250欧元/两版),在线版可免费试用约两个月,但得会写SQL。具体价格以官方页面为准。


六、专业商业付费库(功能全,要钱)

  • incoPat 全球专利数据库

http://www.incopat.vip/

商业付费,收录120个国家、超一亿件专利,中英双语标题摘要,每周更新。适合专业的检索分析。价格以官方为准。

  • 智慧芽 PatSnap

https://www.zhihuiya.com/

国内主流商业付费平台,功能全,数据更新快。检索分析为主,导出受套餐限制。价格以官方为准。


七、国内竞赛/社区平台(不稳定,得自己核实)

  • 阿里云天池 数据集

https://tianchi.aliyun.com/dataset/

有时候会有专利文本竞赛数据集,但这不是常设的专利库,需要去站内搜“专利”,能不能商用看数据集页面。

  • 百度飞桨 AI Studio 开放数据集

https://aistudio.baidu.com/datasetoverview

国内AI社区,偶尔有专利分类/聚类竞赛数据。需要自己去搜,有的不一定能商用。


八、找各国官方源头的“网址索引”

  • CNIPA/PatentDatabases(GitHub)

https://github.com/CNIPA/PatentDatabases

国家知识产权局官方维护的“全球专利信息数据库网址汇总”。按国家/地区找各国官方源,把这个当目录用。

  • 广东省知识产权数据接口服务系统(API示例)

https://open.gpic.gd.cn/doc/expHelp

地方官方的API例子,需要申请、可能受限或收费。说明一点:各地API条件不一,得逐个核实。


九、几个重要提醒(别踩坑)

  1. “能查到” ≠ “能随便用”。批量下载、二次分发、商用前,一定要看许可条款。特别是商业库和整理库,导出和使用都有限制。
  2. 官方源也有使用规则。国家知识产权局有《使用手册》,WIPO、Google Patents也各有条款,按用途看清楚。
  3. 价格、配额、迁移时间都会变。所有数字(导出上限、费用、迁移日期)都以官方当前页面为准,别拿旧笔记当正式决策依据。
  4. API对接要申请。地方和平台的接口大多要走流程,可能受限或收费,逐个确认。

十、说句实在话

这篇帮你省了自己瞎找的时间,但有一点做不到:替你确认“某个库今天的价格、配额、能不能商用”。专利数据最大的特点就是:看得见的多,真能成规模拿走的有门槛。所以别光盯着网址,要盯着“许可+配额+你的用途”这三件事。

如果你觉得太零散,或者想省时间——比如你想做企业创新面板、写论文要专利引用、找可专利性预测语料、要某行业某年专利全量——我们【数聚天成 DeepSData】可以帮你做一次深度数据可得性检索。按你的真实目的,去匹配最合适的源,逐个说清楚:有什么字段、什么格式、免费还是要申请/付费、有没有配额、能不能商用。把“看得到”和“真能拿到、能用在你场景里”分开讲,找不到或只能部分满足的,直接说实话,并给替代路径。要不要做,由你决定。

所有来源均为公开真实链接,价格、配额、字段和迁移时间变动较快,用之前请逐项核对到当天,以各官方页面为准。


本文仅作公开来源整理和可得性参考,不构成医疗、法律、投资、商业决策或合规意见;正式使用前请以官方页面、授权条款和专业意见为准。

说明:本文为公开资料整理,仅供参考;平台政策、价格、下载方式与链接随时可能变化,本文不保证持续更新,请以各官方页面最新信息为准。