【开源发布】MCP Document Converter:让你的 AI 助手精通 25 种文档转换神技!

【开源发布】MCP Document Converter:让你的 AI 助手精通 25 种文档转换神技!
在这里插入图片描述

  【个人主页:玄同765

大语言模型(LLM)开发工程师中国传媒大学·数字媒体技术(智能交互与游戏设计)

深耕领域:
大语言模型开发 / RAG知识库 / AI Agent落地 / 模型微调

技术栈:Python / LangChain/RAG(Dify+Redis+Milvus)| SQL/NumPy | FastAPI+Docker ️

工程能力:专注模型工程化部署、知识库构建与优化,擅长全流程解决方案 

     

「让AI交互更智能,让技术落地更高效」

欢迎技术探讨/项目合作! 关注我,解锁大模型与智能交互的无限可能!

前言:AI 时代的文档处理困境

【好消息】MCP Document Converter 已正式入驻 MCP 官方 Server 列表,并同步发布至 PyPI!

作为一名开发者,在使用 Trae 或 Claude 等 AI 助手时,你是否也曾感到力不从心?

  • 扔给 AI 一个复杂的 PDF,它却告诉你“无法直接读取”?
  • 想要 AI 帮你把 Markdown 文档导出为格式精美的 Word 或 PDF,却得手动复制粘贴?
  • 网页 HTML 代码太乱,AI 分析起来总是抓不住重点?

为了彻底打通 AI 与各种文档格式之间的“次元壁”,我开发并开源了 MCP Document Converter。就在今天,它已正式入驻 MCP 官方 Server 列表


核心亮点:不仅仅是转换,更是 AI 的“语义翻译官”

MCP Document Converter 是基于 Anthropic 推出的 MCP (Model Context Protocol) 协议开发的。它最大的特点是:让 AI 拥有了操作文档的原生能力。

目前,该工具支持以下 5 种核心格式的双向自由转换,共计 25 种转换组合

  1. 📄 PDF (.pdf):采用结构化提取技术,尽可能保留文档原始层级。
  2. 📘 Word (.docx):支持样式、表格的解析与生成,让 AI 也能写公文。
  3. 🌐 HTML (.html):语义化标签解析,支持自定义 CSS 注入,生成精美页面。
  4. 📝 Markdown (.md):针对 AI 交互优化的 MD 格式,支持 YAML 元数据。
  5. 📃 Text (.txt):最纯粹的文本处理,自动检测编码。

为什么它更懂 AI? 因为它在转换过程中会优先保留文档的语义元数据(如标题、作者、创建时间),确保 AI 在处理文档时不会“断章取义”。


快速上手:三步解锁 AI 的“文档超能力”

我已经将项目发布到了 PyPI,并完美适配了 uv 工具链。你无需下载源码,只需几行配置即可启用。

1. 安装依赖
pip install mcp-document-converter 
2. 配置 AI 助手(以 Trae/Claude 为例)

在你的 MCP 配置文件中添加如下代码:

方式一:通过 uvx 直接运行(推荐,自动管理环境)

{ "mcpServers": { "mcp-document-converter": { "command": "uvx", "args": ["mcp-document-converter"] } } } 

方式二:如果你已经安装到本地环境

{ "mcpServers": { "mcp-document-converter": { "command": "python", "args": ["-m", "mcp_document_converter"] } } } 

实战场景:让 AI 动起来

配置完成后,你可以直接在对话框里给 AI 下指令:

  • 场景 A:“帮我把 docs/guide.md 转成带公司样式的 PDF,存到 output/ 文件夹。”
  • 场景 B:“读取这个 resume.pdf,把它转成 Markdown 格式,然后根据内容提取出候选人的技能列表。”
  • 场景 C:“这个 HTML 页面太乱了,帮我转成干净的 Word 文档发给同事。”

AI 会自动调用 convert_document 接口,在后台静默完成所有工作,你只需要坐享其成。


结语:开源精神与未来

MCP Document Converter 采用插件化架构,未来我会持续增加对更多格式(如 Excel、PPT、EPUB)的支持。

如果你觉得这个工具有所帮助,欢迎:

让我们一起,用 MCP 协议重新定义 AI 的工作流!

Read more

CC-Switch 使用攻略:一键管理多款 AI CLI 工具配置

CC-Switch 简介与下载地址 在日常的开发工作中,我们经常会同时使用多个命令行界面的 AI 编程辅助工具,例如 Claude Code、OpenCode、Codex 或 Gemini CLI。这些工具默认都有各自独立的配置文件和目录。当我们需要切换 API 供应商、更改模型或者更新 API Key 时,通常需要手动打开多个不同的 JSON、TOML 或环境变量文件进行修改。 CC-Switch 是一个基于 Tauri 和 Rust 开发的桌面客户端工具,它的主要作用是为上述多个 AI 编程工具提供一个统一的图形化配置界面。通过它,开发者可以在一个软件中管理所有 AI CLI 工具的配置信息。 下载地址与安装方式 CC-Switch 支持跨平台使用。你可以通过以下方式获取并安装: 1. GitHub 发布页 (推荐) 访问项目的官方开源仓库:https:

深度揭秘 DeepSeek:AI 新贵与蓝耘智算平台的完美搭档

深度揭秘 DeepSeek:AI 新贵与蓝耘智算平台的完美搭档

在当今科技飞速发展的时代,人工智能(Artificial Intelligence,简称 AI)已然成为推动社会进步的核心力量。从智能语音助手到自动驾驶,从医疗诊断到金融风险预测,AI 的应用无处不在,深刻地改变着我们的生活和工作方式。随着 AI 技术的不断演进,各种 AI 模型如雨后春笋般涌现,它们在不同的领域展现出独特的能力。而在这众多的模型中,DeepSeek 以其卓越的性能和独特的优势,成为了 AI 领域中一颗耀眼的明星。本文将深入探讨 DeepSeek 的显著优点,并详细介绍如何借助蓝耘智算平台搭建 DeepSeek R1 模型,让更多的人能够体验到这一强大工具的魅力。 一、DeepSeek:AI 领域的璀璨明珠 1.1 DeepSeek卓越性能 * 语言生成:DeepSeek 在语言生成方面表现出色,尤其是在中文语境下,其优势更加明显。它能够生成自然流畅、语义准确的文本,无论是日常对话、文案创作还是学术写作,都能轻松应对。

AI时代人人都是产品经理:架构设计:从 0 到 1 搭建 AI 产品的信息架构与核心业务流程

AI时代人人都是产品经理:架构设计:从 0 到 1 搭建 AI 产品的信息架构与核心业务流程

一、为什么AI产品需要重新设计信息架构? 在传统软件产品中,信息架构(IA)的核心是将功能按用户认知逻辑组织,比如电商APP的"商品-购物车-结算"流程,本质是对"人找货"逻辑的数字化映射。但AI产品的核心逻辑是**“货(服务)找人”**:用户的需求不再是明确的功能调用,而是模糊的任务目标(比如"帮我优化一份市场报告")。 这种差异直接导致了两个核心痛点: * 传统的菜单式导航无法适配AI产品的开放式交互 * 用户对AI能力的认知不清晰,容易产生"不会用"或"用不好"的挫败感 * AI的输出结果不可控,需要在架构层设计"修正-反馈"闭环 核心结论:AI产品的信息架构不是"功能的容器",而是&

GitHub开源项目日报 · 2026年3月26日 · AI Agent与智能感知工具持续火热

GitHub开源项目日报 · 2026年3月26日 · AI Agent与智能感知工具持续火热

本期榜单主要涵盖AI Agent开发框架、多智能体协作系统、金融研究代理、WiFi感知技术以及效率工具等多个方向。AI Agent领域依然是最大热点,其中DeerFlow作为字节跳动推出的开源超级Agent框架,能够通过sub-agents并行处理复杂任务,支持Docker隔离执行和MCP工具扩展,整体功能较为完善;oh-my-claudecode则专注于Claude Code的多智能体编排,提供32个专业智能体自动分工协作,智能模型路由可节省30-50%的token消耗。超过10000星以上的项目有DeerFlow、WiFi DensePose、Twenty、Dexter、oh-my-claudecode和insanely-fast-whisper,其中DeerFlow凭借47889星成为本期最高星项目,WiFi DensePose的星数也超过42000星,前者面向企业级深度研究和内容自动化,后者则实现了基于WiFi信号的实时人体姿态估计和生命体征监测。每日增长超过100星的项目包括oh-my-claudecode、Last30Days、WiFi DensePose、DeerFlow