【2025最新】Python量化数据接口指南:baostock 免费获取分钟级K线教程

baostock 是一个对Python量化爱好者非常友好的免费开源证券数据平台,尤其适合获取A股历史行情数据。我为你准备了这份2025年更新的baostock使用指南,希望能帮助你高效地获取数据。

1. 认识baostock

Baostock(证券宝)是一个免费、开源的证券数据平台。它通过Python API提供大量准确、完整的证券历史行情数据、上市公司财务数据等,能满足量化交易投资者、数量金融爱好者、计量经济从业者的数据需求。

它的数据返回格式为pandas DataFrame类型,这对于使用pandas/NumPy/Matplotlib进行数据分析和可视化非常友好。

2. 数据范围与时间

baostock的数据覆盖范围主要包括:

数据类型

包含内容

时间范围

备注                

股票数据

日、周、月K线数据

1990-12-19至今

5、15、30、60分钟K线数据

1999-07-26至今

指数数据

综合指数,规模指数,一级行业指数,二级行业指数,策略指数,成长指数,价值指数,主题指数,基金指数,债券指数

2006-01-01至今

指数没有分钟线数据

财务数据

部分上市公司资产负债信息、上市公司现金流量信息、上市公司利润信息、上市公司杜邦指标信息

2007年至今

季频

公司报告

上市公司业绩预告信息

2003年至今

季频

上市公司业绩快报信息

2006年至今

季频

每日最新数据更新时间需要注意:

  1. 日K线数据:当前交易日17:30完成入库。
  2. 分钟K线数据:当前交易日20:30完成入库。
  3. 其它财务报告数据:第二自然日1:30完成前交易日数据入库。

3. 安装与环境配置

安装baostock非常简单,只需在命令行中执行:

pip install baostock -i https://pypi.tuna.tsinghua.edu.cn/simple/ --trusted-host pypi.tuna.tsinghua.edu.cn

注意:程序运行时,文件名、文件夹名不能是baostock。

4. 核心API使用详解

4.1 登录与登出

在开始任何数据查询前,都需要先登录系统。建立与服务器的连接无需注册即可登录。需要注意的是,登录后超过一段时间没有操作再调用API请求时会超时,需要重新登录才能继续下载数据。

import baostock as bs #登录系统 lg = bs.login() #显示登录返回信息 print('login respond error_code:' + lg.error_code) print('login respond  error_msg:' + lg.error_msg) #你的数据查询代码将在这里 #登出系统 bs.logout()

4.2 获取历史A股K线数据

`query_history_k_data_plus()` 是获取历史A股K线数据的重要接口。

方法说明:通过API接口获取A股历史交易数据,可以通过参数设置获取日k线、周k线、月k线,以及5分钟、15分钟、30分钟和60分钟k线数据,适合搭配均线数据进行选股和分析。

返回类型:pandas的DataFrame类型。

能获取1990-12-19至当前时间的数据;可查询不复权、前复权、后复权数据。

主要参数:

参数名

描述

是否必须

默认值

code

股票代码,sh或sz.+6位数字代码,或者指数代码,如:sh.601398。sh:上海;sz:深圳。

fields

指示简称,支持多指标输入,以半角逗号分隔,填写内容作为返回类型的列。

start_date

开始日期(包含),格式“YYYY-MM-DD”

2015-01-01

end_date

结束日期(包含),格式“YYYY-MM-DD”

最近一个交易日

frequency

数据类型,默认为d,日k线;d=日k线、w=周、m=月、5=5分钟、15=15分钟、30=30分钟、60=60分钟k线数据,不区分大小写;指数没有分钟线数据;周线每周最后一个交易日才可以获取,月线每月最后一个交易日才可以获取。

d

adjustflag

复权类型,默认不复权:3;1:后复权;2:前复权。已支持分钟线、日线、周线、月线前后复权。

4.3 获取指定日期所有股票列表

`query_all_stock()` 函数可以获取指定交易日期所有股票列表。可以通过参数day获取某一天的数据,参数为空表示默认获取当天的数据。返回类型为baostock自定义的数据类型,通过get_data()函数可以获取Pandas DataFrame类型的数据。

date = "2025-08-01"  #假设的日期,请替换为实际日期 stock_df = bs.query_all_stock(date).get_data()

5. 实战示例:获取分钟级K线数据

以下是一个获取股票分钟级K线数据的完整示例。

5.1 获取5分钟K线数据

import baostock as bs import pandas as pd #登陆系统 lg = bs.login() #显示登陆返回信息 print('login respond error_code:'+lg.error_code) print('login respond  error_msg:'+lg.error_msg) #获取沪深A股历史K线数据 #详细指标参数,参见“历史行情指标参数”章节;“分钟线”参数与“日线”参数不同。“分钟线”不包含指数。 #分钟线指标:date,time,code,open,high,low,close,volume,amount,adjustflag rs = bs.query_history_k_data_plus("sh.600000",  #股票代码,例如:浦发银行     "date,time,code,open,high,low,close,volume,amount,adjustflag",  #指定需要的字段     start_date='2025-07-01',  #开始日期(请替换为实际需要的日期)     end_date='2025-07-31',    #结束日期(请替换为实际需要的日期)     frequency="5",            #频率:5表示5分钟线     adjustflag="3")           #复权类型:3不复权 print('query_history_k_data_plus respond error_code:'+rs.error_code) print('query_history_k_data_plus respond  error_msg:'+rs.error_msg) #打印结果集 data_list = [] while (rs.error_code == '0') & rs.next():     #获取一条记录,将记录合并在一起     data_list.append(rs.get_row_data()) result = pd.DataFrame(data_list, columns=rs.fields) #结果集输出到csv文件   result.to_csv("history_A_stock_k_data.csv", index=False) print(result.head(10))  #打印前10行数据查看 #登出系统 bs.logout()

重要提示:指数没有分钟线数据。尝试获取指数的分钟线数据可能会出错或返回空结果。

5.2 复权类型的区别与选择

`adjustflag` 参数决定了数据的复权方式,这对分析至关重要:

*  1.后复权:复权后价格反映的是真实收益率,便于计算历史收益。

*  2.前复权:复权后价格贴近当前价格,便于技术分析。

*  3.不复权:原始价格数据,包含跳空缺口。

BaoStock使用“涨跌幅复权法”进行复权。这种方法可以计算出资金收益率,确保初始投入的资金运用率为100%,既不会因为分红而导致投资减少,也不会因为配股导致投资增加。需要注意的是,不同系统(如同花顺、通达信等)采用的复权方式可能不一致,会导致数据差异。

5.3 停牌数据处理

股票停牌时,对于日线,开、高、低、收价都相同,且都为前一交易日的收盘价,成交量、成交额为0,换手率为空。

在回测过程中,通常不希望停盘数据对回测造成干扰,可以将停盘数据删除:

if result.shape[0]:     result = result[(result['volume'] != '0') & (result['volume'] != '')]

6. 常见问题与技巧(FAQ)

1. 返回数据格式转换:从BaoStock下载的数据元素类型可能均为object(字符串)。在进行数值计算前,可能需要转换类型,例如换手率:

result["turn"] = [0 if x == "" else float(x) for x in result["turn"]]

2. 查询所有股票代码:可以使用 `query_all_stock()` 函数获取指定日期的所有股票列表,并转换为List:   

 stock_list = stock_df['code'].tolist()

3. 数据准确性交叉验证:对于关键决策,建议使用其他数据源(如券商API、Wind等)进行交叉验证,特别是在复权数据方面,因为不同平台的复权算法可能有差异。

4. 超时与重新登录:登录后如果长时间没有操作,连接可能会超时。如果后续请求失败,可以尝试重新调用 `bs.login()`。

baostock 作为一个免费且数据源稳定的平台,是个人量化爱好者入门和进行中低频策略研究的绝佳工具。希望这份指南能助你在量化交易的道路上顺利起步!

请注意,baostock目前的数据主要集中在A股,缺少港股、期货、外汇和基金等金融数据。对于更高频率(Tick级)的交易或更广泛的品种,你可能需要考虑其他数据源。

Read more

【Python 量化入门】AKshare 保姆级使用教程:零成本获取股票 / 基金 / 期货全市场金融数据

【Python 量化入门】AKshare 保姆级使用教程:零成本获取股票 / 基金 / 期货全市场金融数据

做量化交易、财经数据分析、投资复盘的开发者和投资者,经常会遇到核心痛点:付费金融数据接口成本高、免费 API 注册流程繁琐、多市场数据分散难以整合。告别 QMT 回测烦恼!手把手教你搭建 MiniQMT+Backtrader 量化回测框架 本文就给大家详细讲解 Python 量化圈的开源神器AKshare,从安装到核心功能实战全覆盖,代码可直接复制运行,零基础也能一键获取全市场金融行情数据。 一、AKshare 是什么? AKshare 是一款基于 Python 开发的开源金融数据接口库,专为个人投资者、量化爱好者、财经数据分析人员打造,是目前国内生态最完善、维护最活跃的免费金融数据工具之一。 它支持股票、期货、基金、外汇、债券、指数、加密货币等多种主流金融市场的数据获取,核心优势如下: * 免费开源:完全开源免费,无隐藏收费,个人非商用零成本使用,无需开通付费会员 * 数据覆盖全面:A 股、

By Ne0inhk

双重机器学习之因果推断 | CATE条件平均处理效应估计:五大方法原理详解与模拟数据实战(python版)

家人们我又更新了,代码和科研绘图在论文末尾,欢迎大家评论点赞和收藏,你们的认可是我坚持的动力,祝大家科研顺利。 因果推断 | CATE条件平均处理效应估计:五大方法原理详解与模拟数据实战 本文是因果推断系列文章。本篇聚焦 CATE(Conditional Average Treatment Effect,条件平均处理效应) 的估计,从ATE的局限性讲起,深入介绍S-Learner、T-Learner、X-Learner、因果森林DML和线性DML五种主流方法的原理,并在模拟数据上进行完整的代码实操与效果对比。 1 从ATE到CATE:为什么需要异质性处理效应? 1.1 ATE只能回答"平均有没有用" ATE(Average Treatment Effect)回答的是:干预措施对整个群体的平均效果是什么? 但在实际业务中,我们更想知道的是:对于不同的个体或子群,干预效果有什么不同? 举几个例子: * 精准营销:给所有人发满减券ATE为正,但拆开看,高消费用户根本不需要券,低消费用户反而是增量用户——CATE帮你找到真正的增量人群。 * 个性化医疗:

By Ne0inhk
Python + BS4实战:手把手带你爬取商业数据

Python + BS4实战:手把手带你爬取商业数据

目录 一、bs4篇 1.bs4介绍 1.1 什么是BeautifulSoup4? 1.2 为什么选择BeautifulSoup4?       核心优势 2.bs4详解 2.1 首先下载bs4 2.2 接下来引入一个使用bs4的例子让我们快速熟悉它 2.3 运行结果 3.bs4使用实战案例 3.1 完整代码 3.2 为什么会影响翻页 3.3 反爬机制 3.4 已知信息 3.5 解决思路 3.6 结果展示 3.7 容易混淆的一点 3.8 图片爬虫 🌟 Hello,

By Ne0inhk
Python + AI:打造你的智能害虫识别助手

Python + AI:打造你的智能害虫识别助手

Python + AI:打造你的智能害虫识别助手 在农业生产中,病虫害是影响作物产量和品质的“隐形杀手”。传统的害虫识别依赖人工巡查,不仅耗时耗力,还容易因经验不足导致误判、漏判。而随着智慧农业的普及,AI技术正成为破解这一难题的关键——今天,我们就用Python从零搭建一个智能害虫识别助手,让电脑替你“火眼金睛”辨害虫,轻松搞定农作物病虫害预警! 一、为什么要做这个项目? 智慧农业的核心是“精准、高效、低成本”,而害虫识别正是其中的典型场景: * 对农户:无需专业植保知识,拍照就能识别害虫种类,快速匹配防治方案; * 对开发者:这是一个“小而美”的实战项目,覆盖AI开发全流程,从数据处理到模型部署,学完就能落地; * 技术价值:融合Python、深度学习、Web部署,是入门AI+垂直领域应用的绝佳案例。 这个项目不需要你有深厚的AI功底,只要掌握Python基础,跟着步骤走,就能做出一个能实际使用的智能识别工具。 二、项目核心技术栈 先明确我们要用到的工具,都是行业主流、

By Ne0inhk