LLaMA Factory操作界面微调时报disable multiprocessing.

优质文章学习记录

10 Apr 2026 — 4 min read

LLaMA Factory操作界面微调时报disable multiprocessing

陈述问题

由于显卡性能不强，微调模型时会报以下下错误，GPU内存或系统内存不足，尤其在处理大规模数据或大模型时，子进程因内存溢出崩溃。

 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^ File "G:\project\LLaMA-Factory\src\llamafactory\data\converter.py", line 420, in align_dataset return dataset.map( ^^^^^^^^^^^^ File "C:\Python312\Lib\site-packages\datasets\arrow_dataset.py", line 557, in wrapper out: Union["Dataset", "DatasetDict"] = func(self, *args, **kwargs) ^^^^^^^^^^^^^^^^^^^^^^^^^^^ File "C:\Python312\Lib\site-packages\datasets\arrow_dataset.py", line 3166, in map for rank, done, content in iflatmap_unordered( File "C:\Python312\Lib\site-packages\datasets\utils\py_utils.py", line 713, in iflatmap_unordered raise RuntimeError( RuntimeError: One of the subprocesses has abruptly died during map operation.To debug the error, disable multiprocessing.

解决思路

我们可以调整LlamaFactory 训练命令中 --preprocessing_num_workers

–preprocessing_num_workers 是 LlamaFactoryLlamaFactory（以及基于 Hugging Face 生态的大模型训练框架）中用于数据预处理阶段的核心参数，具体作用如下：核心定义
这个参数指定了数据预处理时使用的进程 / 线程数量（这里设置为 16），用于并行处理训练数据（比如加载数据集、分词、格式化、生成
attention mask 等操作）。具体工作机制默认情况下，preprocessing_num_workers 为
0，意味着所有数据预处理工作都在主线程中串行执行；设置为 16 时，框架会启动 16 个独立的 worker 进程 /
线程，同时对不同批次的数据集进行预处理，充分利用 CPU 多核资源。实际效果 ✅ 加速数据预处理：对于大尺寸数据集（比如几万 /
几十万条样本），多 worker 并行处理能显著减少数据加载和预处理的耗时，避免训练过程中出现 “GPU 等数据” 的空闲情况； ⚠️
资源占用注意：worker 数量并非越多越好：如果设置的数值超过你的 CPU 核心数（比如你的 CPU 只有 8 核却设为
16），会导致进程切换开销增大，反而变慢；过多的 worker 还会占用更多内存，可能引发 OOM（内存溢出）。适用场景
这个参数仅作用于训练前的数据预处理阶段（比如分词、数据格式化），训练过程中的计算（如前向 / 反向传播）仍由 GPU
负责，不会影响训练阶段的并行逻辑。实用建议推荐设置值：通常设为你的 CPU 物理核心数（比如 8 核 CPU 设为 8，16 核设为
16），或核心数的 1-2 倍；调试阶段：如果出现数据加载报错（如 BrokenPipeError），可以先将该值设为
0（单线程）排查问题；内存敏感场景：如果数据集样本长、内存紧张，适当降低该值（比如 8 或 4）。总结
–preprocessing_num_workers 16 表示启用 16 个并行进程处理训练数据的预处理（分词、格式化等）；核心作用是利用多核 CPU 加速数据加载，避免 GPU 训练时等待数据；取值需匹配 CPU
核心数，并非越大越好，否则会增加开销或导致内存不足。

解决办法

点击‘预览命令’查看命令，可以看到命令中 --preprocessing_num_workers 16 `

先把之前运行网页的llamafactory-cli webui的进程停了⚠️⚠️⚠️
再把命令复制到cmd执行，执行前把–preprocessing_num_workers 改小

看到以下界面说明已经在跑了

跑完之后再运行网页的llamafactory-cli webui的进程
再进到网页查看刚才的训练参数可以选择导出了

Google Antigravity，AI IDE新势力

前言 Gemini 3 Pro到来的同时，谷歌也终于入局了AI IDE市场，带来了自己新产品Antigravity。现在市场上有Cursor、Windsurf等IDE,但是它与其他竞品又有显著区别，它是以Agent优先的开发平台，从“辅助者”转变为“主导者”。目前用户可以免费使用Gemini 3 Pro & Flash, Claude Sonnet & Opus 4.5, gpt-oss-120b。那么谷歌的Antigravity会不会是这个市场的一个搅局者呢？这个我觉得还是要看各位开发者的实际用户体验，毕竟现在才推出没多久，后续的收费标准、迭代升级是否会达到大家的预期，都需要时间来给出答案。一、官网及下载地址官网地址：https://antigravity.google/ 下载地址：https://antigravity.google/download (大家根据自己电脑系统下载具体版本)，下载完后，根据默认点击安装即可二、登录 1.

一文彻底讲透AI Infra：从底层逻辑到落地实战，小白也能看懂的技术全攻略

文章目录 * 一、AI Infra到底是什么？用3个生活例子秒懂 * 二、AI Infra的核心组件：4大模块撑起整个AI生态 * 三、AI Infra实战：3个经典场景，代码直接抄 * 场景1：个人副业——搭建AI绘画平台，基于Stable Diffusion+FastAPI部署 * 核心需求 * 技术选型 * 核心代码（简化版，可直接运行） * 部署步骤 * 场景2：企业应用——用LangChain+RAG搭建AI知识库，3小时落地 * 核心需求 * 技术选型 * 核心代码（简化版） * 部署步骤 * 场景3：端侧部署——将AI模型轻量化，适配手机/IoT设备 * 核心需求 * 技术选型 * 核心步骤（含代码片段） * 四、AI Infra的发展趋势：2026年必看的3个方向 * 1.

OpenClaw漏洞预警：如何给AI代理加上“记录仪”？

近日，工信部网络安全威胁和漏洞信息共享平台、国家互联网应急中心连续发布风险提示：开源AI智能体OpenClaw因默认安全配置脆弱、不当配置等问题存在较高安全风险。当AI代理被赋予系统级权限，每一次“幻觉”或攻击都可能酿成数据浩劫而每一次操作在操作系统中留下的痕迹，正是追溯这些风险的关键线索。移动云云日志可为移动云云主机提供命令级、文件级全量日志采集，搭配智能关键词告警与日志长期存储，让云主机上的每一行指令都有迹可循，为AI应用构建日志可追溯的安全防线。四大高危风险，不容忽视 OpenClaw作为开源AI智能体框架，在提升自动化能力的同时，其默认配置存在的安全漏洞可能被恶意利用，导致企业核心数据面临严重威胁。 “AI智能体的安全风险不在于AI本身，而在于我们能否看清AI在系统层面的每一个动作。看不见的风险才是真正的风险。” 而移动云云日志，就是要让这些“看不见”的风险，变得“看得见”。四大核心能力，构建AI安全防线全量行为采集，不留死角支持主流操作系统（CentOS、Ubuntu、WindowsServer等），可采集Shell命令历史、文

AI大模型应用开发：从入门到精通！2026版体系化学习路线_2026年AI大模型应用开发保姆级教程

摘要：随着ChatGPT、文心一言、通义千问等大模型的爆发，掌握AI大模型应用开发已成为开发者进阶、获取高薪的黄金技能！本文由深耕AI领域的ZEEKLOG专家撰写，为你梳理一条清晰、高效、可落地的学习路线，涵盖必备基础、核心理论、关键技术、工具链、项目实战全流程，助你从“小白”快速成长为能独立开发AI应用的高手！文末附赠精选学习资源清单！ 📌 一、为什么学习AI大模型应用开发？ * 时代风口： AI大模型是当前科技革命的核心驱动力，重塑各行各业（办公、教育、医疗、金融、娱乐等），人才缺口巨大，薪资水平水涨船高。 * 降本增效：利用大模型强大的生成、理解、推理能力，可以自动化大量重复性工作，大幅提升开发效率和产品智能化水平。 * 创新机遇：大模型为开发者提供了前所未有的能力基石，催生无数创新应用场景（智能助手、个性化推荐、代码生成、内容创作、智能客服等）。 * 开发者必备技能：未来，理解和应用大模型将成为开发者的一项基础能力，如同现在的Web开发或移动开发。 🧭 二、