金融高频数据去哪找?从免费到付费,一条条给你列清楚

第一件事:先搞明白你要的是“哪一档”

“高频”有三个层次,价格和门槛天差地别。说清楚,能省一大半冤枉钱:

  • 分钟K线(1分钟、5分钟、15分钟……):最容易搞定,下面好几个开源工具都能免费拿。
  • 逐笔成交、Level-2十档行情、订单簿:这才是真正的“高频”。基本要付费或者学术身份,免费最多给你点样品

下次有人跟你聊“高频数据”,先问一句:到底要分钟级,还是要逐笔/Level-2?这俩根本不是一个玩法。

去哪找——一个个来,从免费到最贵

一、国内开源接口库(性价比之王,免费)

如果你或者你手下的人会一丁点Python,这是最划算的路。

  • AKShare

完全免费开源。股票、期货、基金的分钟到日线都有,定位是给学术用的。缺点:数据从第三方网站抓,源站一变它就可能断。

  • Tushare Pro

注册免费,但走积分制——分钟级数据要攒够积分才有正式权限。积分越高,调的频次越多。注意:它的期货逐笔tick高频数据不走接口,只通过CSV网盘交付(近10年历史+每日增量,能按交易所和日期定制)。

  • 天勤 TqSdk(偏期货、期权)

免费版能给全期货、期权、部分股指的实时行情。但那个能下载历史数据、支持tick级精度的工具(DataDownloader)是专业版功能,要付费

二、交易所官方(最权威,也最贵,面向机构)

这是最正、最全的源头,但门槛高、要花钱,普通散户基本进不去——它卖的是机构。

提醒一句:沪深两个交易所的数据结构不一样,同一所不同时期也可能不同,拿到后还要按规范文档清洗,有处理成本。

三、学术金融库(高校/机构订阅为主)

  • CSMAR(原国泰安,运营方深圳希施玛):国内学术主流数据库,19大系列、200多个子库,能导出CSV/Excel/文本。大多为高校或企业订阅,个人散户难拿;单次下载有条数限制(据说每次限300条,以官方页面为准)。
  • 数据库入口:https://data.csmar.com/
  • 介绍页:https://www.csmar.com/channels/31.html
  • Wind资讯金融终端:另一个商业主流,更贵,面向机构。

四、数据科学社区(碰运气找现成)

这类是用户上传或赛题数据,质量和覆盖都不稳定,能不能找到你要的品种和时间段全看运气,自己核验。

五、国际/学术源(找海外数据做方法验证)

  • LOBSTER:NASDAQ全股的限价订单簿高频数据。AAPL、AMZN、GOOG、INTC、MSFT这5只免费样本,全量对学术注册后免费。(入口见这个Quora页面:https://www.quora.com/Where-can-I-download-free-high-frequency-financial-data,官网为lobsterdata.com)
  • Kaggle:有大量用户上传的tick/日内数据集,以加密货币、外汇、股票为主,来源参差,得自己核验。

六、外汇/加密的高频tick(相对好拿,免费)

如果你只是想拿点真高频数据练手、做回测或者验证方法,外汇和加密这块免费tick好拿多了:

可得性总结和小退路

  • 免费、自己直接下:分钟级用AKShare、Tushare(攒够积分);外汇/加密tick用Dukascopy、Binance、dukascopy-node。
  • 要积分/订阅/付费:Tushare的期货tick(CSV网盘付费)、天勤历史下载(专业版)、交易所官方Level-2、Wind终端。
  • 要机构/学术身份:CSMAR、Wind、LOBSTER全量、上交所/深交所官方产品。个人基本进不去。
  • 碰运气、自己核验:和鲸、天池、Kaggle上传的数据集,不保证有你要的品种和时段。

如果国内股票的逐笔tick实在拿不到(大概率拿不到),两条退路

  1. 退一档用分钟K线——很多分析和策略用分钟级就够了,免费还稳定。
  2. 换市场验证方法论——先用外汇或加密的免费tick跑通你的模型,验证逻辑没问题,再考虑要不要为股票逐笔数据花钱。

用之前注意:许可和合规

  • 花钱买来的数据集有授权限制,别随便转发或商用。
  • 开源接口库的数据来自第三方源站,可能变动或失效,正式用前核对一下口径。
  • 社区/Kaggle上的数据只能当线索,别当权威用——做研究或买卖前回官方核对。
  • 各家政策会变:积分门槛、下载条数、免费付费边界都可能调整,最终一律以各官方页面当前说明为准

最后说句实在话

金融高频数据这事,最麻烦的不是“不知道有哪些源”,而是“源太散,而且分不清哪一档自己到底拿不拿得到”。一个人把开源库、交易所官方、学术库、数据社区、国际源全摸一遍,再判断各条路能不能走通,确实挺费时间。

如果觉得太零散,或者想省点时间,你可以找我们——数聚天成 DeepSData,帮你做一次数据可得性深度检索。 按你要的颗粒度(分钟/逐笔tick/Level-2/订单簿)和品种,把候选来源一次列清,并且诚实告诉你:到底能不能拿到、怎么拿、有什么坑。就算最后没找到完全贴合的,检索方向和逐条判定也会照实给你参考。不是每个来源都靠谱,但我们帮你把“能不能用”的答案先挖出来。


本文仅作公开来源整理和可得性参考,不构成医疗、法律、投资、商业决策或合规意见;正式使用前请以官方页面、授权条款和专业意见为准。

说明:本文为公开资料整理,仅供参考;平台政策、价格、下载方式与链接随时可能变化,本文不保证持续更新,请以各官方页面最新信息为准。