从零开始:Stable Diffusion API本地部署与实战调用指南

1. 环境准备与本地部署

想要玩转Stable Diffusion API,第一步得先把环境搭建好。这就像你要做菜,总得先有个厨房对吧?我推荐直接从GitHub克隆官方stable-diffusion-webui项目,这是最稳妥的选择。不过要注意,你的显卡最好是NVIDIA的,显存至少4GB起步,不然跑起来会非常吃力。

安装过程其实比想象中简单。先确保系统有Python 3.10.6,然后按顺序执行这几个命令:

git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git cd stable-diffusion-webui pip install -r requirements.txt 

启动时有个关键点要注意:必须加上--api参数!这个参数就像是打开大门的钥匙,不加的话API功能就用不了。启动命令长这样:

python launch.py --api 

第一次运行会自动下载模型文件,文件比较大可能要等一会儿。我遇到过下载卡住的情况,这时候可以手动把模型文件放到models/Stable-diffusion目录下。模型文件一般叫v1-5-pruned-emaonly.safetensors或者类似的名字。

2. API接口配置与验证

服务启动后,默认会在7860端口监听。打开浏览器访问http://localhost:7860,能看到熟悉的WebUI界面。这时候API其实已经可以用了,但为了安全起见,建议设置下认证。

在webui-user.bat(Windows)或者webui.sh(Linux/Mac)里,可以加上这些参数:

set COMMANDLINE_ARGS=--api --api-auth username:password 

这样就需要用Basic Aut

Read more

实现Python将csv数据导入到Neo4j

实现Python将csv数据导入到Neo4j

目录 一、获取数据集 1.1 获取数据集 1.2 以“记事本”方式打开文件 1.3  另存为“UTF-8”格式文件 1.4 选择“是” 二、 打开Neo4j并运行 2.1 创建新的Neo4j数据库 2.2 分别设置数据库名和密码 编辑 2.3 启动Neo4j数据库 2.4 打开Neo4j数据库  2.5 运行查看该数据库是否为空 三、打开Python创建项目  3.1 创建一个包,存项目 3.2 创建一个项目 3.3 检查自己的依赖是否完全

宇树科技机器人核心技术

宇树科技机器人核心技术

前言 宇树科技作为全球足式/人形机器人领域的标杆企业,其技术体系覆盖消费级(Go2)、工业级(B2)、人形(G1/H1)全产品线,以“硬件自研+软件全栈+AI赋能”构建核心壁垒。本文不仅拆解宇树机器人的关键技术(单硬件、单软件、软硬件协同、AI+),还配套就业技能图谱、学习路线与工具推荐,适合机械、电子、计算机、AI领域开发者/求职者参考。 一、宇树科技机器人核心技术全景(附插图建议) 宇树的技术体系可概括为“四层金字塔结构”,从下到上实现“能运动→会运动→智能运动”的进阶: 技术层级核心定位代表技术应用价值底层硬件机器人“躯体骨架”自研伺服电机、分层计算平台、4D激光雷达保障运动性能与环境适配性全栈软件机器人“智慧大脑”MPC/WBC控制算法、SLAM感知融合、ROS2中间件实现精准控制与灵活交互软硬件协同机器人“神经中枢”实时控制闭环、

GraphRAG论文阅读:From Local to Global: A Graph RAG Approach to Query-Focused Summarization

文章链接:https://arxiv.org/abs/2404.16130 从局部到全局:一种面向查询聚焦摘要生成的GraphRAG方法 摘要 利用检索增强生成(RAG)从外部知识源检索相关信息,使大语言模型(LLMs)能够回答关于私有和/或先前未见过的文档集合的问题。然而,针对整个文本语料库的全局性问题,例如“数据集中的主要主题是什么?”,RAG则无法胜任,因为这本质上是一个查询聚焦的摘要生成(QFS)任务,而非显式的检索任务。同时,先前的QFS方法无法扩展到典型RAG系统索引的文本数量。为了结合这些不同方法的优势,我们提出了GraphRAG,一种基于图的方法,用于在私有文本语料库上进行问答,该方法能随用户问题的广泛性和源文本的数量而扩展。我们的方法使用LLM分两个阶段构建图索引:首先,从源文档中推导出实体知识图谱;然后,为所有紧密相关的实体组预先生成社区摘要。给定一个问题,每个社区摘要被用于生成部分回答,然后所有这些部分回答再次汇总成一个最终回答返回给用户。对于在约100万标记范围内的数据集上的一类全局意义构建问题,我们表明,与传统的RAG基线相比,GraphRAG在生成答

【论文阅读】Vision-skeleton dual-modality framework for generalizable assessment of Parkinson’s disease ga

【论文阅读】Vision-skeleton dual-modality framework for generalizable assessment of Parkinson’s disease ga

论文题目:《Vision-skeleton dual-modality framework for generalizable assessment of Parkinson’s disease gait》 论文链接:https://doi.org/10.1016/j.media.2025.103727  代码链接:https://github.com/FJNU-LWP/PD-gait-VSDF 视觉-骨架双模态框架:通过视频实现帕金森病步态的泛化评估 研究背景介绍 帕金森病评估与帕金森病评分量表(MDS-UPDRS) 帕金森病步态评估 研究内容 总体方法流程 关键点视觉 Transformer (KVT) 图像块嵌入 (Patches embedding) 位置与连接嵌入 (Positions and connections embedding) 关键点自注意力 (Keypoints Self-Attention,