LLaMA Factory操作界面微调时报disable multiprocessing.

优质文章学习记录

07 Apr 2026 — 4 min read

LLaMA Factory操作界面微调时报disable multiprocessing

陈述问题

由于显卡性能不强，微调模型时会报以下下错误，GPU内存或系统内存不足，尤其在处理大规模数据或大模型时，子进程因内存溢出崩溃。

 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^ File "G:\project\LLaMA-Factory\src\llamafactory\data\converter.py", line 420, in align_dataset return dataset.map( ^^^^^^^^^^^^ File "C:\Python312\Lib\site-packages\datasets\arrow_dataset.py", line 557, in wrapper out: Union["Dataset", "DatasetDict"] = func(self, *args, **kwargs) ^^^^^^^^^^^^^^^^^^^^^^^^^^^ File "C:\Python312\Lib\site-packages\datasets\arrow_dataset.py", line 3166, in map for rank, done, content in iflatmap_unordered( File "C:\Python312\Lib\site-packages\datasets\utils\py_utils.py", line 713, in iflatmap_unordered raise RuntimeError( RuntimeError: One of the subprocesses has abruptly died during map operation.To debug the error, disable multiprocessing.

解决思路

我们可以调整LlamaFactory 训练命令中 --preprocessing_num_workers

–preprocessing_num_workers 是 LlamaFactoryLlamaFactory（以及基于 Hugging Face 生态的大模型训练框架）中用于数据预处理阶段的核心参数，具体作用如下：核心定义
这个参数指定了数据预处理时使用的进程 / 线程数量（这里设置为 16），用于并行处理训练数据（比如加载数据集、分词、格式化、生成
attention mask 等操作）。具体工作机制默认情况下，preprocessing_num_workers 为
0，意味着所有数据预处理工作都在主线程中串行执行；设置为 16 时，框架会启动 16 个独立的 worker 进程 /
线程，同时对不同批次的数据集进行预处理，充分利用 CPU 多核资源。实际效果 ✅ 加速数据预处理：对于大尺寸数据集（比如几万 /
几十万条样本），多 worker 并行处理能显著减少数据加载和预处理的耗时，避免训练过程中出现 “GPU 等数据” 的空闲情况； ⚠️
资源占用注意：worker 数量并非越多越好：如果设置的数值超过你的 CPU 核心数（比如你的 CPU 只有 8 核却设为
16），会导致进程切换开销增大，反而变慢；过多的 worker 还会占用更多内存，可能引发 OOM（内存溢出）。适用场景
这个参数仅作用于训练前的数据预处理阶段（比如分词、数据格式化），训练过程中的计算（如前向 / 反向传播）仍由 GPU
负责，不会影响训练阶段的并行逻辑。实用建议推荐设置值：通常设为你的 CPU 物理核心数（比如 8 核 CPU 设为 8，16 核设为
16），或核心数的 1-2 倍；调试阶段：如果出现数据加载报错（如 BrokenPipeError），可以先将该值设为
0（单线程）排查问题；内存敏感场景：如果数据集样本长、内存紧张，适当降低该值（比如 8 或 4）。总结
–preprocessing_num_workers 16 表示启用 16 个并行进程处理训练数据的预处理（分词、格式化等）；核心作用是利用多核 CPU 加速数据加载，避免 GPU 训练时等待数据；取值需匹配 CPU
核心数，并非越大越好，否则会增加开销或导致内存不足。

解决办法

点击‘预览命令’查看命令，可以看到命令中 --preprocessing_num_workers 16 `

先把之前运行网页的llamafactory-cli webui的进程停了⚠️⚠️⚠️
再把命令复制到cmd执行，执行前把–preprocessing_num_workers 改小

看到以下界面说明已经在跑了

跑完之后再运行网页的llamafactory-cli webui的进程
再进到网页查看刚才的训练参数可以选择导出了

Springboot 整合 Java DL4J 打造自然语言处理之智能写作助手

🧑 博主简介：ZEEKLOG博客专家，历代文学网（PC端可以访问：https://literature.sinhy.com/#/literature?__c=1000，移动端可微信小程序搜索“历代文学”）总架构师，15年工作经验，精通Java编程，高并发设计，Springboot和微服务，熟悉Linux，ESXI虚拟化以及云原生Docker和K8s，热衷于探索科技的边界，并将理论知识转化为实际应用。保持对新技术的好奇心，乐于分享所学，希望通过我的实践经历和见解，启发他人的创新思维。在这里，我希望能与志同道合的朋友交流探讨，共同进步，一起在技术的世界里不断学习成长。

灵感画廊入门：AI绘画零基础到精通

灵感画廊入门：AI绘画零基础到精通 “见微知著，凝光成影。将梦境的碎片，凝结为永恒的视觉诗篇。” 你是否曾有过这样的瞬间？脑海中闪过一个绝妙的画面，却苦于无法用画笔将其呈现。或者，你渴望创作，却被复杂的软件和技法门槛拒之门外。今天，这一切都将改变。 “灵感画廊”正是为你准备的。它不是一个冰冷的AI工具，而是一个静谧的“灵感捕捉空间”。基于强大的Stable Diffusion XL 1.0模型，它用艺术沙龙般的界面，将复杂的AI绘画变得像在咖啡馆里写生一样简单。无论你是毫无绘画基础的纯小白，还是寻求新灵感的创作者，这篇文章都将带你从零开始，一步步掌握这个优雅的创作工具，将你的想象力变为触手可及的艺术品。 1. 从想象到画面：灵感画廊初体验在深入学习之前，让我们先快速感受一下“灵感画廊”的魅力。它的核心设计哲学是“文艺式交互”，这意味着它将技术术语全部替换成了富有诗意的表达，让你感觉是在与一位懂你的艺术家合作，而不是在操作一台机器。 1.1 核心概念：用“人话”理解AI绘画为了让你毫无障碍地上手，

Llama-3.2-3B部署实录：Ollama本地大模型从下载到生成仅需90秒

Llama-3.2-3B部署实录：Ollama本地大模型从下载到生成仅需90秒想体验最新的大语言模型，但又担心复杂的部署流程和漫长的等待时间？今天，我要分享一个极其简单的方案：使用Ollama在本地部署Meta最新发布的Llama-3.2-3B模型。整个过程从下载模型到生成第一段文字，最快只需要90秒，而且完全免费，不需要任何复杂的配置。 Llama-3.2-3B是Meta推出的轻量级多语言大模型，虽然只有30亿参数，但在很多任务上的表现已经相当出色。更重要的是，它非常“亲民”，对普通电脑配置要求不高，通过Ollama这个工具，你可以像安装一个普通软件一样把它装到自己的电脑上，随时随地调用。这篇文章，我将带你走一遍完整的部署流程，从零开始，手把手教你如何用最简单的方法，在自己的电脑上跑起这个强大的AI助手。 1. 准备工作：认识我们的工具和模型在开始动手之前，我们先花一分钟了解一下今天要用到的两个核心：Ollama和Llama-3.2-3B模型。了解它们是什么，能帮你更好地理解后面的每一步操作。 1.1 Ollama：你的本地大模型管家你可以把Ollama想象成

3分钟快速上手：llama-cpp-python完整安装配置指南

3分钟快速上手：llama-cpp-python完整安装配置指南【免费下载链接】llama-cpp-pythonPython bindings for llama.cpp 项目地址: https://gitcode.com/gh_mirrors/ll/llama-cpp-python 想要在本地快速运行大语言模型却苦于复杂的安装配置？llama-cpp-python是专为新手打造的Python集成库，让您轻松访问强大的llama.cpp推理引擎。这份完整的技术工具安装配置指南将带您从零开始，快速上手本地AI开发！🚀 📦 基础安装：一步到位 llama-cpp-python的安装过程极其简单，只需一行命令： pip install llama-cpp-python 这个命令会自动从源码构建llama.cpp，并将其与Python包一起安装。如果遇到构建问题，可以添加--verbose参数查看详细构建日志。 ⚡ 硬件加速配置想要获得最佳性能？根据您的硬件选择合适的加速后端： CUDA加速（NVIDIA显卡） CMAKE_ARGS="-DGGML_CUDA=