【技术深水区】抖音 WEB 端逆向：从零到一拿下 a_bogus 参数

优质文章学习记录

10 Apr 2026 — 6 min read

前言

a_bogus 相比于之前的 x-bogus，这家伙隐藏得更深，而且裹挟着 JSVMP 混淆，让很多想要抓取数据的同学头疼不已。

注意：本文仅用于技术学习与交流，请勿用于非法爬取商业数据，所有后果自负。

一、什么是 a_bogus？

在抖音的 WEB 端请求中，a_bogus 是一个必不可少的请求签名参数。

它的作用类似于一张“动态身份证”，服务端会根据请求的 URL、参数、环境指纹等计算出签名，只有签名正确，服务器才返回真实数据。如果你直接复制浏览器里的请求链接，或者单纯注释掉 a_bogus，返回的数据要么是空的，要么直接是 403。

二、逆向分析环境准备

正式开始之前，你需要具备以下基础（如果你已经是大佬，请跳过）：

熟悉浏览器的开发者工具（Network 面板、Sources 面板）。
掌握 XHR 断点、条件断点、日志断点的用法。
了解基础的 JavaScript 语法。
知道如何利用 curlconverter 将请求转换为 Python 代码。

三、实战拆解：追踪 a_bogus 的生成逻辑

1. 选取目标接口

以抖音的关键词搜索接口为例：

https://www.douyin.com/aweme/v1/web/general/search/single/

这个接口用于搜索视频内容，参数复杂且加密严密，是逆向分析的绝佳对象。

2. 接口参数分析

打开浏览器开发者工具，刷新页面，在 Network 面板中找到上述接口。

复制它的 cURL(bash)，使用 curlconverter.com 转换为 Python 代码，方便我们测试。

观察请求参数，你会发现除了常规的 keyword、offset 等参数外，还有两个让人头疼的变量：msToken 和 a_bogus。

分别注释掉这两个参数进行请求，发现缺了任何一个都会导致请求失败。本文我们重点攻克 a_bogus。

3. 定位加密位置

3.1 全局搜索失效

直接在 Sources 面板搜索 a_bogus，发现代码被混淆，根本搜不到明文。这说明抖音做了代码混淆，我们需要换一种思路——XHR 断点。

3.2 使用 XHR 断点

在 Sources 面板右侧，找到 XHR/fetch Breakpoints，点击 +，输入接口路径的关键词 general/search/single。

设置好后刷新页面，页面会自动断在发送请求的代码处。3.3 分析堆栈调用

断下来后，查看右侧的 Call Stack（调用堆栈）。

堆栈是从下往上执行的，我们需要找到 生成 a_bogus 的那个堆栈帧。

往下翻堆栈，找到 请求参数中还没有 a_bogus 的地方。
往上翻，找到 请求参数中已经有了 a_bogus 的地方。

这两个位置之间的某个函数，就是加密函数。关键点：不要只找一个堆栈就停下，要逐个查看作用域（Scope）中的 params 或 data 对象，看是否有 a_bogus 字段。

4. 精细调试：日志断点与条件断点

最终，我们定位到了一个混淆很严重的 JS 文件（通常是 bdms.js 之类的），代码看起来像这样：

var result = s.apply(b, u);

这个地方很难一眼看出 s 是干什么的，但我们可以设置日志断点。

在 s.apply(b, u) 这行右键，选择 Add logpoint，输出内容设为：

返回值：{result}

刷新页面，看控制台打印的日志，你会发现有很多 true、false、数字以及字符串。

观察那些字符串，你会惊奇地发现：

短的那一串看起来像是我们请求的 URL 参数拼接。
长的那一串长度大约在 160 位左右，看起来就是我们要找的 a_bogus。

为了精准定位，我们可以设置条件断点：比如当返回值长度大于 150 时再断下来。

result.length > 150

最终，我们找到了生成 a_bogus 的核心函数，它在 e 函数内部。

四、补环境与代码封装

找到核心函数后，将 bdms.js 文件下载到本地。

1. 补环境

直接运行这段 JS 会报错，因为缺少浏览器环境（window, document, navigator 等）。我们需要模拟这些环境：

window = global; delete global; delete Buffer; window.requestAnimationFrame = function(){}; XMLHttpRequest = function() {}; document = {} navigator = {}; screen = { availHeight: 816, availLeft: 0, availTop: 0, availWidth: 1536, colorDepth: 24, height: 864 }

2. 导出加密函数

分析函数调用逻辑，发现 e 函数被调用时的参数 u 包含了很多环境信息（如 UA、屏幕宽高等）和请求参数。

我们可以将其封装成一个标准的 getSign 函数，只接收 params 字符串作为入参：

function getSign(params) { u = [ 0, 1, 14, params, "", "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/124.0.0.0 Safari/537.36 Edg/124.0.0.0" ] var r = window.sign_z._v; return (0,window.sign_z._u)(r[0], u, r[1], r[2], this) }

这样，在 Python 中调用 execjs 执行这段代码，输入参数字符串，就能得到 a_bogus 了。

五、最终测试

# 伪代码示例import execjsimport requestswithopen('douyin.js','r', encoding='utf-8')as f: ctx = execjs.compile(f.read())params_str ="device_platform=webapp&aid=6383&keyword=飞驰人生2..."a_bogus = ctx.call('getSign', params_str)print(a_bogus)# 输出类似：mXmZMdzgdDfiDDWX5VcLfY3q6WB3Y/R30CPYMD2f7dVr...

将生成的 a_bogus 塞回请求参数中，你会发现数据正常返回了。

写在最后

看到这你已经对抖音 WEB 端的加密参数 a_bogus 有了比较深的理解。

但是，抖音的反爬体系是动态更新的：msToken 和 a_bogus 的算法是否会变？
补环境的时候是否需要更多指纹？
如果被封 IP 了怎么办？

逆向是一场无止境的博弈。

想直接拿到稳定、高并发、低延迟的解决方案，可以查看我的主页，有封装好的 API 接口和完整的 SDK。

如果你有定制需求，也欢迎直接私信我。

AI 编程助手三强争霸：OpenCode vs Claude Code vs Kimi Code CLI 深度对比

摘要：2025 年 AI 编程工具百花齐放，OpenCode 以开源自由席卷开发者社区，Claude Code 凭官方背书稳居高端市场，Kimi Code CLI 靠超长上下文和中文优势异军突起。本文从功能、成本、适用场景等 8 个维度深度拆解三款工具，帮你找到最适合自己的 AI 编程搭档。一、工具概览 1.1 OpenCode —— 开源界的"瑞士军刀" 属性详情开发商anomalyco 社区开源协议100% 开源GitHub Stars10万+核心卖点模型自由、LSP 内置、多会话并行费用免费（自备 API Key） OpenCode 是 2024 年底爆火的开源 AI 编程 Agent，短短数月斩获

OpenClaw（龙虾）开源AI智能体科普解析：核心原理、功能特性与本地部署教程

近期开源AI领域，OpenClaw（俗称“龙虾”）凭借其本地优先、可定制的特性，受到开发者社区的广泛关注，其项目保活程度与社区活跃度可通过GitHub数据直观体现：目前该项目已获得222k stars、1.2k watching、42.3k forks，各项数据均处于开源AI智能体领域前列，足以证明其社区认可度与持续更新能力。作为一款开源AI智能体工具，它在办公自动化、系统辅助等场景具有实用价值，适合开发者了解和落地实践。 OpenClaw是一款开源的个人AI助手编排平台，采用TypeScript开发，目前在GitHub上拥有较高的关注度，其核心价值在于将大模型的推理能力与本地系统操作相结合，打破了传统AI助手“仅能交互、无法执行”的局限。本文将从技术科普角度，围绕OpenClaw的核心定义、功能特性、技术细节及本地部署步骤展开，帮助开发者全面了解这款工具的原理与使用方法。对于ZEEKLOG的开发者群体而言，了解OpenClaw的技术架构与应用场景，既能拓展AI智能体的认知边界，也能将其应用于日常开发、办公场景，提升工作效率。本文将从「核心定义、功能特性、技术细节、本地部署」

人工智能：大语言模型（LLM）原理与应用实战

人工智能：大语言模型（LLM）原理与应用实战 1.1 本章学习目标与重点 💡 学习目标：掌握大语言模型的核心原理、训练流程与微调方法，学会基于开源大语言模型完成定制化对话与文本生成任务。 💡 学习重点：理解大语言模型的Transformer decoder-only架构，掌握指令微调与RLHF技术，能够使用LoRA高效微调开源LLM。 1.2 大语言模型的核心概念与发展历程 1.2.1 什么是大语言模型 💡 大语言模型（Large Language Model, LLM）是参数量达到十亿级甚至万亿级的Transformer-based模型。它通过在海量文本数据上进行预训练，学习语言的语法、语义、常识和推理能力。 LLM的核心能力包括文本生成、理解、翻译、摘要、问答等。它可以处理复杂的自然语言任务，无需针对每个任务单独设计模型结构。 LLM与传统NLP模型的核心区别： * 参数量级：传统模型参数量通常在千万级，LLM参数量可达十亿到万亿级。 * 训练数据：传统模型依赖标注数据，LLM使用海量无标注文本进行预训练。 * 能力边界：传统模型只能处理单一任务，LL

想系统学AIGC？这个知识店铺专为AI爱好者打造

大家好，我是袁庭新，一名深耕人工智能领域的从业者，同时也是一名创业者。知识店铺在AI技术飞速迭代的当下，各大科技巨头企业在不断实现技术突破，AI已深度重构各行业工作模式、并融入我们的日常生活。为帮助千行百业的从业者们紧跟技术浪潮、筑牢职场竞争力，以及推动人工智能技术应用的知识普及，因此创建了「圆心AI」知识店铺，助力学员在数字时代抢占先机。店铺长这个样子，见下图：如何访问我们的知识店铺呢？在wechat中访问下方链接也可打开店铺。 https://appnsxeqcvr5122.h5.xet.citv.cn 当然，如果你是B站、淘宝的忠实用户，可以在这些平台上找到我们的店铺，是不是很爽！为什么学为什么人人都必须要学AI呢？“你是卖课的，当然这么说了”——很多网友会这么觉得。我们正在亲历前所未有的变革——互联网改变了信息传递的方式，指数级技术快速发展并颠覆商业世界，人工智能正在侵占越来越多的人类领地。正是身处在这个行业，我才深刻意识到，一项真正具有革命性的技术，正汹涌的渗入这个时代。所以，我才All in做这件事，所以我才如此真诚的在这里分享。为什

前言