AIGC(生成式AI)试用 47 -- AI与软件开发过程2

一切从 AIGC(生成式AI)试用 46 -- AI与软件开发过程1 开始,修正偏差。

个人理解:
- 从框架到细节,还是从细节到框架? -- 先有框架再有细节的好,LLM能适应框架下的细节补充
- 更细节的Agent,更有针对性的Agent,解决更细节问题的Agent -- LLM提供了另一种形式的开发工具
- 想要,架构,细节,实现。。。。。。往复迭代,更多的接口,更多小而美的功能软件
- 回复有错吗?当然,错误和偏差大量存在。
  如何纠偏、调优?这些专业知识 和 经验,还需要创造

  • 先解决3问题
  1. 确认软件开发过程各阶段所需完成的任务活动,以选择不同LLM
    问题定义与可行性研究 → 需求分析 → 软件设计 → 编码与实现 → 测试 → 部署与交付 → 运行与维护 → 退役
     (文字分析/逻辑判定/文档/会议)    |  (代码生成/调试/评审/测试/报告)|    (专业技术库/业务知识库)                             |
  2. 规避前期问题
    - 需求未明确前,避免代码生成,包括样例
    - 强化交互过程中LLM对所提问题的质疑+反馈+测试验证
    - 规范软件开发过程阶段活动执行,细化需求
    - 迭代实现,回溯对比验证

确认各LLM的特点,以选择更有效的LLM完成任务。是否合适,边用边看边调整 -- 只用不花钱的官网(GPT, Gemini)
- 豆包:日常协调
- 文心一言:资料查询
- DeepSeek:代码实现
- 通义千问:文档处理

提问: 豆包,文心一言,deepseek,千问 各自的特点是什么,更适合做的任务是什么,以表格形式输出
豆包
模型名称研发主体核心特点最适合任务主要局限
豆包字节跳动响应极快、中文自然、多模态强(图文 / 语音 / 视频)、与抖音 / 剪映 / 飞书生态打通、免费额度充足日常问答、生活服务、短视频脚本、新媒体文案、会议纪要、快速办公、语音交互超复杂推理、深度科研能力一般
文心一言百度中文语义 / 文化理解强、与百度搜索深度融合、知识问答稳定、公文 / 法律 / 古文生成优秀知识查询、资料整理、公文写作、法律 / 医疗咨询、学术文献梳理、热点解读创意表达、多模态体验偏弱
DeepSeek深度求索代码 / 数学 / 逻辑推理顶尖、长上下文高效、开源透明、性价比极高、支持本地部署代码生成 / 调试、算法设计、数学证明、科研推理、长文档分析、开发者工具多模态弱、交互体验偏简洁、闲聊能力一般
通义千问阿里云中文写作 / 翻译顶尖、长文本稳定、企业级服务成熟、与夸克搜索 / 阿里生态协同专业文案、报告撰写、多语言翻译、企业办公、长文档处理、API 集成开发个人端功能较保守、复杂任务响应偏慢
文心一言
模型名称核心特点适合任务
豆包多模态交互(文本/图像/视频/音频)、深度思考模式、AI编程辅助、Seedream 4.0图像生成、视频动态化、语音转写摘要、免费无限云盘、万字报告生成智能对话、编程辅助、图像/视频创作、会议记录、音乐生成、云盘存储、研究报告撰写、社交媒体文案、短视频脚本、跨格式文件分析
文心一言知识增强/检索增强/对话增强、多版本模型(3.5/4.0/工具版/Turbo)、文本生成、文学创作、商业文案、图表制作、多语言翻译、文档分析、社区功能问答系统、文本生成、文学创作、商业文案、图表制作、多语言翻译、文档分析、网页分析、智慧绘画、会议纪要、学术研究辅助
DeepSeek混合专家架构(MoE)、动态注意力机制、长文本处理(万字级)、低资源部署、领域自适应、多任务统一框架、安全可控机制金融风控、医疗诊断、智能制造、法律文书分析、代码生成、反欺诈系统、设备故障预测、长文档解析、专业术语生成、数据可视化、学术报告撰写
千问多模态能力、百万字长文档处理、低成本API0.2/百万Token)、生态整合(淘宝/钉钉等)、超长上下文(1000Tokens)、图像识别、文件上传、联网搜索办公文档处理、长报告分析、PPT生成、代码生成、图像识别、表格处理、生活场景应用、学术文献解析、商务邮件撰写、跨平台数据整合、个性化学习支持
DeepSeek
模型名称核心特点更适合做的任务一句话总结
豆包综合能力均衡,实用性强。由字节跳动推出,在推理整合和特定领域知识(如国际中文教育)方面表现突出。新上线的深入研究功能,能快速生成结构化的报告和方案。信息整理与方案策划:如制定旅行攻略、进行复杂购物决策分析、解读最新政策、输出研究报告。
教育辅助:在知识问答和综合任务处理上表现良好。
全能型助手,擅长把复杂信息整理得井井有条。
文心一言多模态与逻辑推理能力强。由百度开发,在图像理解、复杂逻辑推理(如数学计算)和多轮对话方面表现优异。对中文和中国文化的理解深刻,专业术语解释准确。专业性内容创作:撰写商业计划书、学术论文框架搭建、技术文档翻译。
视觉分析:识别和理解图像中的复杂信息。
逻辑推演:解决需要严谨推理的数学或逻辑问题。
多模态专家,擅长理解图像和进行深度逻辑思考。
DeepSeek技术向与开发友好。在代码生成、编程和数学计算方面表现卓越,支持多种编程语言,被广泛应用于开发者的日常工作中。编程开发:代码生成与补全、调试、跨文件上下文感知。
数据分析:SQL生成、数据洞察、自动化报表。
智能运维与自动化任务:处理日志异常检测、构建自动化工作流。
技术大牛,写代码和分析数据是它的强项。
通义千问生态整合与深度分析能力强。由阿里巴巴推出,新版本已进化为超级AI智能体,打通了阿里生态(如淘宝、支付宝、高德),能一站式完成复杂的生活与工作任务。同时,其文档分析能力兼具完整性和深度。生活服务与办公办事:一句话点外卖、订机票、查攻略、完成政务查询。
深度文档分析:处理长篇文本,进行深入分析和主题把握。
跨应用任务执行:需要调用多个工具和APP才能完成的复杂指令。
超级智能体,帮你把事情办成而不只是问答
通义千问
模型名称开发公司/机构主要特点更适合的任务场景
豆包(Doubao字节跳动集成于字节生态(如抖音、今日头条)
强调日常助手功能(日程、学习、娱乐)
界面友好,面向C端用户
日常生活助手、学生学习辅导、轻量级内容创作、信息查询、娱乐互动
文心一言百度中文理解与生成能力强
与百度搜索、文库、地图等深度整合
支持多模态(图文、文档等)
中文内容生成(公文、营销文案)、企业知识管理、搜索引擎增强、教育问答
DeepSeek深度求索(DeepSeek专注代码与数学推理
- DeepSeek'-Coder 系列在编程领域表现突出
支持长上下文(128K+
编程辅助、算法开发、技术文档生成、数学建模、科研计算、代码审查
通义千问(Qwen阿里云(通义实验室)开源生态完善(QwenQwen'-AudioQwen'-VL等)
多语言支持好
企业级部署能力强
支持超长上下文(最高百万token
企业智能客服、多语言翻译、复杂文档分析、AI Agent开发、科研与工程应用
  • 开始系统实现过程,实现自己最熟悉的IT开发过程
    - 目标:构建一套软件测试管理系统

开始提问
- DeepSeek
- 遵从软件开发过程:问题定义与可行性研究 → 需求分析 → 软件设计 → 编码与实现 → 测试 → 部署与交付 → 运行与维护 → 退役

→ 提问及回复约束
提问0请以中文输出以下内容,并遵循:
1. 在没有明确要求输出代码前请不要输出任何代码
2. 在回复问题时请列举存疑内容并进行反问、寻求答案,直至存在任何疑问全部解决
→ 问题定义与可行性研究(略)
→ 需求分析
提问1构建一套软件测试管理系统,请先给出你的理解和建议,形成完成的系统需求定义
提问2系统需求补充以下内容,重新生成系统需求定义
1. 系统需要记录、统计各角色、各阶段、各活动的工时及分布
2. 是否已有现有流程或工具? -- 当前使用excel进行缺陷管理,同时需要接入jira,并计划接入其他管理系统

    是否需要支持移动端测试管理? -- 系统需要支持移动端访问

    是否涉及自动化测试集成?-- 需要提供devlop中的自动化测试系统接口

    测试类型是否有特殊要求? -- 需要支持单元测试、功能测试、集成测试、系统测试、性能测试、安全测试、兼容性测试等多种类型的测试分类及管理

    组织规模与并发量 -- 当前仅需支持200人在线同时访问,

    部署方式 -- 目前有联想服务器可供部署(忽略服务器选项)

    是否有特定的安全合规要求? -- 需满足标准的软件开发流程,提供自定义选项,无其他特别要求

提问3

系统需求补充以下内容,重新生成系统需求定义
    自动化测试系统具体类型? -- 仅提供自动化系统接口,获取测试执行结果

    Jira集成的深度需求? -- 仅提供由jira导入测试产出物(测试需求、环境、用例、缺陷、结果)导入功能

    工时管理细化程度? -- 提供与项目相关的所有工时记录,包括计划、培训、会议,提供计划与实际的对比

    移动端访问的具体场景? -- 提供web访问页面,app会有独立项目进行开发,不在此次考虑范围

    历史数据迁移范围? -- 提供excel数据导入功能

→ 软件设计
提问1需求已定义,请按以下进行软件设计
- python开发语言(python3.12及以上),django框架
- VUE界面开发,保持界面美观
- 系统支持sqlite和mysql数据库
请提供系统架构图及业务流程图

1. 系统架构图(C4模型分层风格)

2. 核心业务流程图(测试管理全流程)

3. 集成接口时序图(Jira导入与自动化测试结果接收)

4. 数据库ER简图(核心表关系)
 

提问2请提供美化后的类似visio的架构图和流程图

1 系统架构图(更新,突出用例管理模块内部结构)

2 测试用例管理业务流程图(详细展示设计、评审、版本、执行)

提问3添加新需求:测试用例管理部分(测试用例设计、评审、版本管理、执行管理),并重新生成需求和系统设计
→ 编码与实现 → 测试 (略)
提问1按当前需求分析和设计
1. 生成完整的系统结构目录和代码包
2. 完成系统自测
3. 补充系统需求不足并输出变更内容
→ 部署与交付 → 运行与维护 → 退役 (略)

>> 问题定义与可行性研究 → 需求分析

>> 软件设计

>> 系统实现

Read more

用ToClaw打造AI自动助手:重复任务一键托管,告别加班(附实操场景)

用ToClaw打造AI自动助手:重复任务一键托管,告别加班(附实操场景)

前言 每天打开电脑,其实都会做很多重复性的事情:清理桌面、查看信息、整理文件、检查任务状态……这些事情单独看都不复杂,但它们每天都在发生,而且一套流程下来就要花掉不少时间。 更关键的是,这些工作大多不需要动脑,属于典型的机械重复,但你又必须亲自去完成。时间久了,就会陷入一种很典型的状态——事情不难,但很耗时间;可以不做,但又不能不做。 这就是很多人都会遇到的“重复任务困境”。 而这类问题, ToClaw 能帮你完美解决。ToClaw 是 ToDesk 推出的桌面AI助手,不只是一个聊天工具,而是一个可以真正帮你“执行任务”的助手。通过自然语言,你可以直接让它帮你处理文件、分析信息、执行操作,甚至自动完成一整套流程。 在这篇文章里,我会用几个实际场景,来展示我是如何用 ToClaw 搭建一个“自动干活助手”的,把那些每天都要做的重复任务交给 AI,而我只需要关注最终结果。 一、ToClaw

清华团队首发OpenClaw研究报告:AI智能体生态闭环全解析

清华团队首发OpenClaw研究报告:AI智能体生态闭环全解析

🍃 予枫:个人主页 📚 个人专栏: 《Java 从入门到起飞》《读研码农的干货日常》《Java 面试刷题指南》 💻 Debug 这个世界,Return 更好的自己! 引言 近期“龙虾”OpenClaw持续爆火,GitHub星标数一路飙升,成为AI智能体领域的现象级开源项目。就在这时,清华沈阳教授团队重磅首发两份OpenClaw专项研究报告,从理论到实践、从自我研究到生态布局,给出了最全面的解读,堪称OpenClaw学习的“官方指南”,程序员和AI从业者必看! 文章目录 * 引言 * 一、OPENCLAW双报告核心概况 * 1.1 《OpenClaw发展研究报告1.0》:严谨迭代的生态指南 * 1.2 《OpenClaw自我研究报告1.0》:AI研究AI的标杆实验 * 二、OPENCLAW领域阶段性进展 * 2.1 理论研究:筑牢生态基础,扩大科普影响力 * 2.2 模型研发:

要成为AI的主人,而不是被它所绑架

要成为AI的主人,而不是被它所绑架

这两年,AI 编码工具确实给开发效率带来了很大提升。写脚本更快了,补测试更轻松了,搭原型更顺手了,连很多文档工作都被大幅压缩。笔者自己在持续使用 GPT-5.4 和 Claude 一段时间后,也真切感受到了这种效率红利。与此同时,随着使用越来越深入,笔者也开始经常在架构师论坛和技术社区里,围绕 AI 开发的安全性、保密性、稳定性、可控性等问题,与多位大厂架构师持续交流。讨论得越多、实践得越久,我越认同一个判断:小项目、低敏项目、单人维护项目,AI 基本没有大问题;但一旦进入多人协作、长期演进、涉及核心资产和生产责任的项目,AI 如果没有边界、规范和审计,就很容易从“效率工具”变成“失控放大器”。 很多人讨论 AI,还停留在“能不能更快把功能做出来”这个层面。但架构师的关注点从来不只是“能不能开发出来”,而是“

AI辅助编程入门:大模型写代码靠谱吗

AI辅助编程入门:大模型写代码靠谱吗

AI辅助编程入门:大模型写代码靠谱吗 📝 本章学习目标:通过本章学习,你将全面掌握"AI辅助编程入门:大模型写代码靠谱吗"这一核心主题,建立系统性认知。 一、引言:为什么这个话题如此重要 在人工智能快速发展的今天,AI辅助编程入门:大模型写代码靠谱吗已经成为每个AI从业者和爱好者必须了解的核心知识。无论你是技术背景还是非技术背景,理解这一概念都将帮助你更好地把握AI时代的机遇。 1.1 背景与意义 💡 核心认知:大模型技术正在深刻改变我们的工作和生活方式。作为这一变革的见证者和参与者,我们需要系统性地理解其背后的原理和应用。 从2022年ChatGPT的横空出世,到如今百花齐放的大模型生态,短短几年间,AI技术已经渗透到各行各业。根据最新统计,全球大模型市场规模已突破千亿美元,年增长率超过50%。这一数字背后,是无数企业和个人正在经历的数字化转型。 1.2 本章结构概览 为了帮助读者系统性地掌握本章内容,我将从以下几个维度展开: 📊 理论基础 → 核心概念 → 技术原理 → 实践应用 → 案例分析 → 总结展望 二、核心概念解析 2.1