金融高频数据去哪找?从免费到付费,一条条给你列清楚
第一件事:先搞明白你要的是“哪一档”
“高频”有三个层次,价格和门槛天差地别。说清楚,能省一大半冤枉钱:
- 分钟K线(1分钟、5分钟、15分钟……):最容易搞定,下面好几个开源工具都能免费拿。
- 逐笔成交、Level-2十档行情、订单簿:这才是真正的“高频”。基本要付费或者学术身份,免费最多给你点样品。
下次有人跟你聊“高频数据”,先问一句:到底要分钟级,还是要逐笔/Level-2?这俩根本不是一个玩法。
去哪找——一个个来,从免费到最贵
一、国内开源接口库(性价比之王,免费)
如果你或者你手下的人会一丁点Python,这是最划算的路。
- AKShare
完全免费开源。股票、期货、基金的分钟到日线都有,定位是给学术用的。缺点:数据从第三方网站抓,源站一变它就可能断。
- Tushare Pro
注册免费,但走积分制——分钟级数据要攒够积分才有正式权限。积分越高,调的频次越多。注意:它的期货逐笔tick高频数据不走接口,只通过CSV网盘交付(近10年历史+每日增量,能按交易所和日期定制)。
- 积分权限表:https://tushare.pro/document/1?doc_id=290
- tick数据怎么拿:https://tushare.pro/document/2?doc_id=314(具体以页面为准)
- 天勤 TqSdk(偏期货、期权)
免费版能给全期货、期权、部分股指的实时行情。但那个能下载历史数据、支持tick级精度的工具(DataDownloader)是专业版功能,要付费。
- 代码仓库:https://github.com/shinnytech/tqsdk-python
- 下载工具文档:https://doc.shinnytech.com/tqsdk/latest/reference/tqsdk.tools.download.html
二、交易所官方(最权威,也最贵,面向机构)
这是最正、最全的源头,但门槛高、要花钱,普通散户基本进不去——它卖的是机构。
- 上交所(上证所信息网络公司):Level-1/Level-2历史行情、快照、逐笔成交、分钟K线都有。快照每3秒一笔买卖盘口,逐笔是毫秒级。
- 历史数据:https://www.sseinfo.com/services/assortment/historical/
- 最精细的Level-2产品(十档价量、逐笔明细):https://www.sseinfo.com/services/assortment/level2/
- 深交所(深圳证券信息公司):历史增强行情数据从2008年1月1日起,覆盖全市场全品种,需要授权。
- 授权入口:http://www.szsi.cn/cpfw/fwsq/hq/yw-2.htm(以官方为准)
提醒一句:沪深两个交易所的数据结构不一样,同一所不同时期也可能不同,拿到后还要按规范文档清洗,有处理成本。
三、学术金融库(高校/机构订阅为主)
- CSMAR(原国泰安,运营方深圳希施玛):国内学术主流数据库,19大系列、200多个子库,能导出CSV/Excel/文本。大多为高校或企业订阅,个人散户难拿;单次下载有条数限制(据说每次限300条,以官方页面为准)。
- 数据库入口:https://data.csmar.com/
- 介绍页:https://www.csmar.com/channels/31.html
- Wind资讯金融终端:另一个商业主流,更贵,面向机构。
四、数据科学社区(碰运气找现成)
这类是用户上传或赛题数据,质量和覆盖都不稳定,能不能找到你要的品种和时间段全看运气,自己核验。
- 和鲸社区 Heywhale:https://www.heywhale.com/home/dataset(免费版每天下载有限额)
- 阿里云天池:https://tianchi.aliyun.com/dataset/(含基金申赎、AntSQL金融语义等赛题数据,但没见到全市场逐笔高频)
五、国际/学术源(找海外数据做方法验证)
- LOBSTER:NASDAQ全股的限价订单簿高频数据。AAPL、AMZN、GOOG、INTC、MSFT这5只免费样本,全量对学术注册后免费。(入口见这个Quora页面:https://www.quora.com/Where-can-I-download-free-high-frequency-financial-data,官网为lobsterdata.com)
- Kaggle:有大量用户上传的tick/日内数据集,以加密货币、外汇、股票为主,来源参差,得自己核验。
六、外汇/加密的高频tick(相对好拿,免费)
如果你只是想拿点真高频数据练手、做回测或者验证方法,外汇和加密这块免费tick好拿多了:
- Dukascopy 银行历史数据:免费导出1600多个品种的tick到月线CSV,外汇/加密/股票都有,适合回测。https://www.dukascopy.com/swiss/english/marketwatch/historical/
- dukascopy-node(开源工具):命令行批量下载Dukascopy历史tick,覆盖股票/加密/外汇。https://github.com/Leo4815162342/dukascopy-node
- Binance 官方历史数据:能下逐笔成交等加密高频历史数据,免费。https://data.binance.vision/
可得性总结和小退路
- 免费、自己直接下:分钟级用AKShare、Tushare(攒够积分);外汇/加密tick用Dukascopy、Binance、dukascopy-node。
- 要积分/订阅/付费:Tushare的期货tick(CSV网盘付费)、天勤历史下载(专业版)、交易所官方Level-2、Wind终端。
- 要机构/学术身份:CSMAR、Wind、LOBSTER全量、上交所/深交所官方产品。个人基本进不去。
- 碰运气、自己核验:和鲸、天池、Kaggle上传的数据集,不保证有你要的品种和时段。
如果国内股票的逐笔tick实在拿不到(大概率拿不到),两条退路:
- 退一档用分钟K线——很多分析和策略用分钟级就够了,免费还稳定。
- 换市场验证方法论——先用外汇或加密的免费tick跑通你的模型,验证逻辑没问题,再考虑要不要为股票逐笔数据花钱。
用之前注意:许可和合规
- 花钱买来的数据集有授权限制,别随便转发或商用。
- 开源接口库的数据来自第三方源站,可能变动或失效,正式用前核对一下口径。
- 社区/Kaggle上的数据只能当线索,别当权威用——做研究或买卖前回官方核对。
- 各家政策会变:积分门槛、下载条数、免费付费边界都可能调整,最终一律以各官方页面当前说明为准。
最后说句实在话
金融高频数据这事,最麻烦的不是“不知道有哪些源”,而是“源太散,而且分不清哪一档自己到底拿不拿得到”。一个人把开源库、交易所官方、学术库、数据社区、国际源全摸一遍,再判断各条路能不能走通,确实挺费时间。
如果觉得太零散,或者想省点时间,你可以找我们——数聚天成 DeepSData,帮你做一次数据可得性深度检索。 按你要的颗粒度(分钟/逐笔tick/Level-2/订单簿)和品种,把候选来源一次列清,并且诚实告诉你:到底能不能拿到、怎么拿、有什么坑。就算最后没找到完全贴合的,检索方向和逐条判定也会照实给你参考。不是每个来源都靠谱,但我们帮你把“能不能用”的答案先挖出来。
本文仅作公开来源整理和可得性参考,不构成医疗、法律、投资、商业决策或合规意见;正式使用前请以官方页面、授权条款和专业意见为准。
说明:本文为公开资料整理,仅供参考;平台政策、价格、下载方式与链接随时可能变化,本文不保证持续更新,请以各官方页面最新信息为准。
参考来源
- https://github.com/akfamily/akshare
- https://akshare.akfamily.xyz/
- https://tushare.pro/document/1?doc_id=290
- https://tushare.pro/document/2?doc_id=314
- https://doc.shinnytech.com/tqsdk/latest/reference/tqsdk.tools.download.html
- https://github.com/shinnytech/tqsdk-python
- https://www.sseinfo.com/services/assortment/historical/
- https://www.sseinfo.com/services/assortment/level2/
- http://www.szsi.cn/cpfw/fwsq/hq/yw-2.htm
- https://data.csmar.com/
- https://www.csmar.com/channels/31.html
- https://www.heywhale.com/home/dataset
- https://tianchi.aliyun.com/dataset/
- https://www.quora.com/Where-can-I-download-free-high-frequency-financial-data
- https://www.dukascopy.com/swiss/english/marketwatch/historical/
- https://github.com/Leo4815162342/dukascopy-node
- https://data.binance.vision/
