专利数据去哪找?先码住这篇,省得自己乱翻
这篇就是给你列个清单,哪些地方能免费看,哪些地方要花钱,哪些地方是专给搞科研/搞AI用的。先收藏,以后用得上。
一、国内官方免费渠道(先从这里开始)
- 国家知识产权局 · 专利检索及分析系统
https://pss-system.cponline.cnipa.gov.cn/
官方免费。注册后能查、能下中国专利,还收录了100多个国家的数据。查国内专利,这是最稳的起点。
- 中国专利公布公告(国家知识产权局)
官方免费。查中国专利的公开、授权公告原始信息,跟上面的系统不是一回事,这个更偏向“公告”。
- 国家知识产权公共服务平台
官方平台。里面有《知识产权数据使用手册及开放目录》,想搞清楚官方到底开放了哪些数据,从这里看。
- 国家知识产权局官网 · 数据栏目
https://www.cnipa.gov.cn/col/col61/index.html
官方的宏观专利统计、年报啥的,做行业概览用,具体口径以页面为准。
二、做学术研究用的“整理好的”面板数据(多要钱或机构订阅)
- CnOpenData
经管研究常用。包含中国专利全量申请授权、专利引用、绿色专利、A股上市公司专利等,号称14亿+条。一般是订阅或按数据集购买,别想着能免费全量拿走。
- 国泰安 CSMAR
也有专利子库,字段很全(申请日、授权公告日、发明人、被引次数等),覆盖1985年至今。高校多用机构订阅,个人难免费拿全量,具体看你学校有没有买。
三、国际权威免费渠道(查全球/PCT专利)
- WIPO PATENTSCOPE(世界知识产权组织)
https://patentscope.wipo.int/search/zh/search.jsf
官方免费。收录约1.238亿件专利文献(含520万件PCT申请),覆盖70多个专利局。基础检索免注册,免费账户可保存检索、设置提醒。注意:每次最多导出1万条到Excel,适合查、不适合一次全搬。
顺便一提: 欧洲专利局的Espacenet、Google Patents,和PATENTSCOPE并称“三大免费检索”,都能免费看。
四、给AI/批量分析/数据建模用的(需要点技术)
- Google Patents Public Datasets(托管在BigQuery)
https://github.com/google/patents-public-data
谷歌公开的专利数据集,在BigQuery上,会写SQL就能查,成本低,不用整包下载。Kaggle上也有镜像(kaggle.com/datasets/bigquery/patents)。
- PatentsView 数据下载(美国专利局USPTO)
https://patentsview.org/downloads/data-downloads
免费CSV和批量表,覆盖美国1976年至今,还把同名发明人/机构区分开了(叫“消歧”)。重要提醒:官方说2026年3月20日会迁移到data.uspto.gov,旧入口可能没法用,用之前去官网确认。
- USPTO 批量数据下载
https://www.google.com/googlebooks/uspto.html
美国专利商标局的批量数据(Google托管的下载入口),全文/著录都能下。免费,但文件很大。
- 哈佛USPTO专利数据集 HUPD
专门给机器学习用的语料。2004–2018年约450万件美国专利申请,34个字段。公开可下,在Hugging Face和GitHub上都有(具体链接见上)。
- OECD 知识产权统计
https://www.oecd.org/sti/inno/intellectual-property-statistics-and-analysis.htm
含按地区(REGPAT)、引用(Citations)、三方专利家族等指标库。大多填表申请后可免费获取,以官方答复为准。
五、最权威的统计大库(要花钱)
- EPO PATSTAT(世界专利统计数据库)
https://www.epo.org/en/searching-for-patents/business/patstat
统计研究最权威的大库,约9000万条。付费(大约1250欧元/两版),在线版可免费试用约两个月,但得会写SQL。具体价格以官方页面为准。
六、专业商业付费库(功能全,要钱)
- incoPat 全球专利数据库
商业付费,收录120个国家、超一亿件专利,中英双语标题摘要,每周更新。适合专业的检索分析。价格以官方为准。
- 智慧芽 PatSnap
国内主流商业付费平台,功能全,数据更新快。检索分析为主,导出受套餐限制。价格以官方为准。
七、国内竞赛/社区平台(不稳定,得自己核实)
- 阿里云天池 数据集
https://tianchi.aliyun.com/dataset/
有时候会有专利文本竞赛数据集,但这不是常设的专利库,需要去站内搜“专利”,能不能商用看数据集页面。
- 百度飞桨 AI Studio 开放数据集
https://aistudio.baidu.com/datasetoverview
国内AI社区,偶尔有专利分类/聚类竞赛数据。需要自己去搜,有的不一定能商用。
八、找各国官方源头的“网址索引”
- CNIPA/PatentDatabases(GitHub)
https://github.com/CNIPA/PatentDatabases
国家知识产权局官方维护的“全球专利信息数据库网址汇总”。按国家/地区找各国官方源,把这个当目录用。
- 广东省知识产权数据接口服务系统(API示例)
https://open.gpic.gd.cn/doc/expHelp
地方官方的API例子,需要申请、可能受限或收费。说明一点:各地API条件不一,得逐个核实。
九、几个重要提醒(别踩坑)
- “能查到” ≠ “能随便用”。批量下载、二次分发、商用前,一定要看许可条款。特别是商业库和整理库,导出和使用都有限制。
- 官方源也有使用规则。国家知识产权局有《使用手册》,WIPO、Google Patents也各有条款,按用途看清楚。
- 价格、配额、迁移时间都会变。所有数字(导出上限、费用、迁移日期)都以官方当前页面为准,别拿旧笔记当正式决策依据。
- API对接要申请。地方和平台的接口大多要走流程,可能受限或收费,逐个确认。
十、说句实在话
这篇帮你省了自己瞎找的时间,但有一点做不到:替你确认“某个库今天的价格、配额、能不能商用”。专利数据最大的特点就是:看得见的多,真能成规模拿走的有门槛。所以别光盯着网址,要盯着“许可+配额+你的用途”这三件事。
如果你觉得太零散,或者想省时间——比如你想做企业创新面板、写论文要专利引用、找可专利性预测语料、要某行业某年专利全量——我们【数聚天成 DeepSData】可以帮你做一次深度数据可得性检索。按你的真实目的,去匹配最合适的源,逐个说清楚:有什么字段、什么格式、免费还是要申请/付费、有没有配额、能不能商用。把“看得到”和“真能拿到、能用在你场景里”分开讲,找不到或只能部分满足的,直接说实话,并给替代路径。要不要做,由你决定。
所有来源均为公开真实链接,价格、配额、字段和迁移时间变动较快,用之前请逐项核对到当天,以各官方页面为准。
本文仅作公开来源整理和可得性参考,不构成医疗、法律、投资、商业决策或合规意见;正式使用前请以官方页面、授权条款和专业意见为准。
说明:本文为公开资料整理,仅供参考;平台政策、价格、下载方式与链接随时可能变化,本文不保证持续更新,请以各官方页面最新信息为准。
参考来源
- https://pss-system.cponline.cnipa.gov.cn/
- http://epub.cnipa.gov.cn/
- https://ggfw.cnipa.gov.cn/
- https://www.cnipa.gov.cn/col/col61/index.html
- https://github.com/CNIPA/PatentDatabases
- https://www.cnopendata.com/
- https://www.gtarsc.com/
- http://www.incopat.vip/
- https://www.zhihuiya.com/
- https://patentscope.wipo.int/search/zh/search.jsf
- https://github.com/google/patents-public-data
- https://patentsview.org/downloads/data-downloads
- https://www.google.com/googlebooks/uspto.html
- https://patentdataset.org/
- https://www.epo.org/en/searching-for-patents/business/patstat
- https://www.oecd.org/sti/inno/intellectual-property-statistics-and-analysis.htm
- https://tianchi.aliyun.com/dataset/
- https://aistudio.baidu.com/datasetoverview
- https://open.gpic.gd.cn/doc/expHelp
