AIGC（生成式AI）试用 47 -- AI与软件开发过程2

优质文章学习记录

11 Apr 2026 — 13 min read

一切从 AIGC（生成式AI）试用 46 -- AI与软件开发过程1 开始，修正偏差。

个人理解：
- 从框架到细节，还是从细节到框架？ -- 先有框架再有细节的好，LLM能适应框架下的细节补充
- 更细节的Agent，更有针对性的Agent，解决更细节问题的Agent -- LLM提供了另一种形式的开发工具
- 想要，架构，细节，实现。。。。。。往复迭代，更多的接口，更多小而美的功能软件
- 回复有错吗？当然，错误和偏差大量存在。
如何纠偏、调优？这些专业知识和经验，还需要创造

先解决3问题

确认软件开发过程各阶段所需完成的任务活动，以选择不同LLM
问题定义与可行性研究 → 需求分析 → 软件设计 → 编码与实现 → 测试 → 部署与交付 → 运行与维护 → 退役
（文字分析/逻辑判定/文档/会议） | （代码生成/调试/评审/测试/报告）| (专业技术库/业务知识库) |
规避前期问题
- 需求未明确前，避免代码生成，包括样例
- 强化交互过程中LLM对所提问题的质疑+反馈+测试验证
- 规范软件开发过程阶段活动执行，细化需求
- 迭代实现，回溯对比验证

确认各LLM的特点，以选择更有效的LLM完成任务。是否合适，边用边看边调整 -- 只用不花钱的官网(GPT, Gemini)
- 豆包：日常协调
- 文心一言：资料查询
- DeepSeek：代码实现
- 通义千问：文档处理

提问：豆包，文心一言，deepseek，千问各自的特点是什么，更适合做的任务是什么，以表格形式输出
豆包
模型名称	研发主体	核心特点	最适合任务	主要局限
豆包	字节跳动	响应极快、中文自然、多模态强（图文 / 语音 / 视频）、与抖音 / 剪映 / 飞书生态打通、免费额度充足	日常问答、生活服务、短视频脚本、新媒体文案、会议纪要、快速办公、语音交互	超复杂推理、深度科研能力一般
文心一言	百度	中文语义 / 文化理解强、与百度搜索深度融合、知识问答稳定、公文 / 法律 / 古文生成优秀	知识查询、资料整理、公文写作、法律 / 医疗咨询、学术文献梳理、热点解读	创意表达、多模态体验偏弱
DeepSeek	深度求索	代码 / 数学 / 逻辑推理顶尖、长上下文高效、开源透明、性价比极高、支持本地部署	代码生成 / 调试、算法设计、数学证明、科研推理、长文档分析、开发者工具	多模态弱、交互体验偏简洁、闲聊能力一般
通义千问	阿里云	中文写作 / 翻译顶尖、长文本稳定、企业级服务成熟、与夸克搜索 / 阿里生态协同	专业文案、报告撰写、多语言翻译、企业办公、长文档处理、API 集成开发	个人端功能较保守、复杂任务响应偏慢
文心一言
模型名称		核心特点	适合任务
豆包		多模态交互（文本/图像/视频/音频）、深度思考模式、AI编程辅助、Seedream 4.0图像生成、视频动态化、语音转写摘要、免费无限云盘、万字报告生成	智能对话、编程辅助、图像/视频创作、会议记录、音乐生成、云盘存储、研究报告撰写、社交媒体文案、短视频脚本、跨格式文件分析
文心一言		知识增强/检索增强/对话增强、多版本模型（3.5/4.0/工具版/Turbo）、文本生成、文学创作、商业文案、图表制作、多语言翻译、文档分析、社区功能	问答系统、文本生成、文学创作、商业文案、图表制作、多语言翻译、文档分析、网页分析、智慧绘画、会议纪要、学术研究辅助
DeepSeek		混合专家架构（MoE）、动态注意力机制、长文本处理（万字级）、低资源部署、领域自适应、多任务统一框架、安全可控机制	金融风控、医疗诊断、智能制造、法律文书分析、代码生成、反欺诈系统、设备故障预测、长文档解析、专业术语生成、数据可视化、学术报告撰写
千问		多模态能力、百万字长文档处理、低成本API（0.2元/百万Token）、生态整合（淘宝/钉钉等）、超长上下文（1000万Tokens）、图像识别、文件上传、联网搜索	办公文档处理、长报告分析、PPT生成、代码生成、图像识别、表格处理、生活场景应用、学术文献解析、商务邮件撰写、跨平台数据整合、个性化学习支持
DeepSeek
模型名称		核心特点	更适合做的任务	一句话总结
豆包		综合能力均衡，实用性强。由字节跳动推出，在推理整合和特定领域知识（如国际中文教育）方面表现突出。新上线的“深入研究”功能，能快速生成结构化的报告和方案。	信息整理与方案策划：如制定旅行攻略、进行复杂购物决策分析、解读最新政策、输出研究报告。教育辅助：在知识问答和综合任务处理上表现良好。	全能型助手，擅长把复杂信息整理得井井有条。
文心一言		多模态与逻辑推理能力强。由百度开发，在图像理解、复杂逻辑推理（如数学计算）和多轮对话方面表现优异。对中文和中国文化的理解深刻，专业术语解释准确。	专业性内容创作：撰写商业计划书、学术论文框架搭建、技术文档翻译。视觉分析：识别和理解图像中的复杂信息。逻辑推演：解决需要严谨推理的数学或逻辑问题。	多模态专家，擅长理解图像和进行深度逻辑思考。
DeepSeek		技术向与开发友好。在代码生成、编程和数学计算方面表现卓越，支持多种编程语言，被广泛应用于开发者的日常工作中。	编程开发：代码生成与补全、调试、跨文件上下文感知。数据分析：SQL生成、数据洞察、自动化报表。智能运维与自动化任务：处理日志异常检测、构建自动化工作流。	技术大牛，写代码和分析数据是它的强项。
通义千问		生态整合与深度分析能力强。由阿里巴巴推出，新版本已进化为“超级AI智能体”，打通了阿里生态（如淘宝、支付宝、高德），能一站式完成复杂的生活与工作任务。同时，其文档分析能力兼具完整性和深度。	生活服务与办公办事：一句话点外卖、订机票、查攻略、完成政务查询。深度文档分析：处理长篇文本，进行深入分析和主题把握。跨应用任务执行：需要调用多个工具和APP才能完成的复杂指令。	超级智能体，帮你把事情“办成”而不只是“问答”。
通义千问
模型名称	开发公司/机构	主要特点	更适合的任务场景
豆包（Doubao）	字节跳动	- 集成于字节生态（如抖音、今日头条） - 强调日常助手功能（日程、学习、娱乐） - 界面友好，面向C端用户	日常生活助手、学生学习辅导、轻量级内容创作、信息查询、娱乐互动
文心一言	百度	- 中文理解与生成能力强 - 与百度搜索、文库、地图等深度整合 - 支持多模态（图文、文档等）	中文内容生成（公文、营销文案）、企业知识管理、搜索引擎增强、教育问答
DeepSeek	深度求索（DeepSeek）	- 专注代码与数学推理 - DeepSeek'-Coder 系列在编程领域表现突出 - 支持长上下文（128K+）	编程辅助、算法开发、技术文档生成、数学建模、科研计算、代码审查
通义千问（Qwen）	阿里云（通义实验室）	- 开源生态完善（Qwen、Qwen'-Audio、Qwen'-VL等） - 多语言支持好 - 企业级部署能力强 - 支持超长上下文（最高百万token）	企业智能客服、多语言翻译、复杂文档分析、AI Agent开发、科研与工程应用

开始系统实现过程，实现自己最熟悉的IT开发过程
- 目标：构建一套软件测试管理系统

开始提问
- DeepSeek
- 遵从软件开发过程：问题定义与可行性研究 → 需求分析 → 软件设计 → 编码与实现 → 测试 → 部署与交付 → 运行与维护 → 退役

→ 提问及回复约束
提问0	请以中文输出以下内容，并遵循： 1. 在没有明确要求输出代码前请不要输出任何代码 2. 在回复问题时请列举存疑内容并进行反问、寻求答案，直至存在任何疑问全部解决
→ 问题定义与可行性研究（略）
→ 需求分析
提问1	构建一套软件测试管理系统，请先给出你的理解和建议，形成完成的系统需求定义
提问2	系统需求补充以下内容，重新生成系统需求定义 1. 系统需要记录、统计各角色、各阶段、各活动的工时及分布 2. 是否已有现有流程或工具？ -- 当前使用excel进行缺陷管理，同时需要接入jira，并计划接入其他管理系统是否需要支持移动端测试管理？ -- 系统需要支持移动端访问是否涉及自动化测试集成？-- 需要提供devlop中的自动化测试系统接口测试类型是否有特殊要求？ -- 需要支持单元测试、功能测试、集成测试、系统测试、性能测试、安全测试、兼容性测试等多种类型的测试分类及管理组织规模与并发量 -- 当前仅需支持200人在线同时访问，部署方式 -- 目前有联想服务器可供部署（忽略服务器选项）是否有特定的安全合规要求？ -- 需满足标准的软件开发流程，提供自定义选项，无其他特别要求
提问3	系统需求补充以下内容，重新生成系统需求定义自动化测试系统具体类型？ -- 仅提供自动化系统接口，获取测试执行结果 Jira集成的深度需求？ -- 仅提供由jira导入测试产出物（测试需求、环境、用例、缺陷、结果）导入功能工时管理细化程度？ -- 提供与项目相关的所有工时记录，包括计划、培训、会议，提供计划与实际的对比移动端访问的具体场景？ -- 提供web访问页面，app会有独立项目进行开发，不在此次考虑范围历史数据迁移范围？ -- 提供excel数据导入功能
→ 软件设计
提问1	需求已定义，请按以下进行软件设计 - python开发语言(python3.12及以上)，django框架 - VUE界面开发，保持界面美观 - 系统支持sqlite和mysql数据库请提供系统架构图及业务流程图
1. 系统架构图（C4模型分层风格） 2. 核心业务流程图（测试管理全流程） 3. 集成接口时序图（Jira导入与自动化测试结果接收） 4. 数据库ER简图（核心表关系）
提问2	请提供美化后的类似visio的架构图和流程图
1 系统架构图（更新，突出用例管理模块内部结构） 2 测试用例管理业务流程图（详细展示设计、评审、版本、执行）
提问3	添加新需求：测试用例管理部分（测试用例设计、评审、版本管理、执行管理），并重新生成需求和系统设计
→ 编码与实现 → 测试（略）
提问1	按当前需求分析和设计 1. 生成完整的系统结构目录和代码包 2. 完成系统自测 3. 补充系统需求不足并输出变更内容
→ 部署与交付 → 运行与维护 → 退役（略）