博客列表·第 23 页

PythonAI算法

DeepSeek R1 在 RK3588 上的 RKLLM 转换与 Web 部署流程

记录了在瑞芯微 RK3588 开发板上部署 DeepSeek R1 7B 模型的全过程。首先升级 NPU 驱动至 0.9.8 版本以支持 RKLLM 推理库；接着在 x86 环境下使用 rkllm-toolkit 将 Hugging Face 的 safetensors 权重转换为 .rkllm 格式并进行 W8A8 量化；随后在板端通过 C++ 示例或 Python Gradio 服务加载模型进行推理；最后实现局域网内的 Web 访问…

片刻发布于 2026/4/5更新于 2026/4/2020 浏览6 点赞约 16 分钟阅读

JavaAI大前端java算法

基于飞算 JavaAI 的智能在线考试系统设计与实现

介绍基于飞算 JavaAI 开发的智能在线考试系统。系统采用 Vue 3 前端与 Spring Boot 后端，结合 MySQL 和 Redis。核心功能包括用户管理、题库管理、自动组卷、在线考试防作弊及智能判卷。通过 AI 辅助生成大量代码，提升了开发效率。实现了多角色权限控制、数据可视化分析及高并发支持，解决了传统考试效率低、数据分析弱的问题，为教育信息化提供技术解决方案。

技术博主发布于 2026/4/5更新于 2026/4/2024 浏览5 点赞约 26 分钟阅读

C++AI算法

Intel GPU 加速 llama.cpp：SYCL 后端配置与性能调优指南

介绍如何在 Intel Arc 显卡上使用 SYCL 后端加速 llama.cpp 大语言模型推理。内容涵盖 Intel oneAPI 工具链安装、环境变量配置、编译参数优化、设备检测验证及内存管理策略。通过量化格式选择和基准测试，可实现显著的性能提升。同时提供常见编译错误和运行时问题的故障排除方案，帮助用户在 Linux 环境下完成环境搭建与调优。

数字游民发布于 2026/4/5更新于 2026/4/2012 浏览1 点赞约 9 分钟阅读

编程语言AI算法

Llama-3.2-3B 部署：Ollama 镜像免配置及 Mac M1/M2 原生运行实测

Llama-3.2-3B 模型的部署与实测。该模型由 Meta 推出，专为多语言对话优化。文章展示了基于 Ollama 服务的免配置部署方案，特别针对 Mac M1/M2 芯片进行了原生运行测试。实测数据显示，模型加载仅需 1-2 分钟，响应速度约 15-20 token/s，内存占用约 4GB，且发热控制良好。内容涵盖环境准备、部署步骤、性能数据、使用技巧及常见问题解答，适合个人用户和小型项目快速体验大模型能力。

FlinkHero发布于 2026/4/5更新于 2026/4/2010 浏览3 点赞约 9 分钟阅读

PythonAI算法

通义万相 2.1 多模态 AI 生成模型技术解析与应用

通义万相 2.1 作为多模态 AI 生成模型的架构优势，包括 Wan-VAE 时空压缩、DiT 架构及 IC-LoRA 技术。文章详细阐述了其在文生视频、文生图片等功能上的表现，以及在影视、广告、游戏等领域的应用场景。通义万相 2.1 在 VBench 评测中表现优异，展现了强大的生成能力和广泛的实用价值。

灭霸发布于 2026/4/5更新于 2026/4/209 浏览2 点赞约 8 分钟阅读

C++AI算法

在 WSL2 Ubuntu 上部署 llama.cpp

介绍在 WSL2 Ubuntu 环境下编译和部署 llama.cpp 的方法。内容包括安装依赖、CPU 及 GPU（CUDA）后端编译配置、以及从 Hugging Face 或 ModelScope 下载 GGUF 格式模型的具体步骤。旨在帮助用户在本地高效运行 LLaMA 等大语言模型。

城市逃兵发布于 2026/4/6更新于 2026/4/209 浏览3 点赞约 9 分钟阅读

PythonSaaSPay算法

同花顺 API 收费模式与档位选择指南

解析同花顺 API 三层阶梯式收费体系，涵盖基础档、进阶档和专业档。通过实测对比各档位的数据延迟、功能权限及接口调用限制，帮助投资者根据自身交易频率和数据需求选择合适的方案。基础档适合散户查看行情，进阶档支持多市场深度数据，专业档面向机构高频交易。

静心发布于 2026/4/5更新于 2026/4/2019 浏览3 点赞约 3 分钟阅读

PythonAI算法

Stable Diffusion 3.5 FP8 在博物馆展览视觉设计中的应用

Stable Diffusion 3.5 结合 FP8 量化技术可显著降低显存占用并提升推理速度，适用于博物馆展览视觉设计场景。通过优化提示词解析与多模态架构，该方案能快速生成高质量海报、文物复原图及虚拟展厅预览。部署上采用后训练量化（PTQ），支持本地化运行以保障数据安全。实施建议包括建立专用提示词库、管理显存配置、人工审核文化准确性及保留生成元数据，以实现技术与策展工作的有效融合。

协议工匠发布于 2026/3/23更新于 2026/4/2021797 浏览133 点赞约 6 分钟阅读

PythonAI算法

7 款开源 LLM WebUI 工具推荐

7 款开源 LLM WebUI 工具，涵盖 Open WebUI、Text Generation WebUI、Anything LLM、LibreChat、Web LLM、OpenLLM 及 LoLLMs。这些工具支持私有化部署、多模型兼容、RAG 集成及本地推理，适用于企业自动化、个人学习及业务集成场景。

追风少年发布于 2026/4/6更新于 2026/4/2016 浏览2 点赞约 21 分钟阅读

C++AI算法

开源机器人选型全指南

提供开源机器人选型全指南，涵盖应用场景分类、操作系统与硬件平台对比（如 ROS2、Jetson）、机器人类型（移动、机械臂、人形、四足）及预算分级。通过五步选型流程确定最佳方案，并推荐 2025 年高性价比产品。强调社区支持、兼容性与扩展性，帮助开发者从入门到专业级完成设备选择。

灭霸发布于 2026/3/26更新于 2026/4/207 浏览2 点赞约 10 分钟阅读

C++算法

C++ 与 Linux 基础：用 C++ 实现简易 Shell 进程控制

C++ 实现简易 Shell，涵盖 exec 系列函数详解（execl, execv, execvp, execvpe）、用户指令获取、子进程创建与执行。通过 fork 和 exec 替换进程映像，实现命令行解析与命令运行功能。

MongoKing发布于 2026/2/25更新于 2026/4/207 浏览1 点赞约 10 分钟阅读

PythonNode.jsSaaSAI算法

10 款主流网络爬虫工具深度对比与选型指南

深度评测了 10 款主流网络爬虫工具，涵盖 Scrapy、Selenium、Bright Data、Octoparse 等。从技术能力、易用性、成本模型、扩展性及维护负担五个维度进行对比。针对个人学习、非技术人员及企业级不同场景给出选型建议。重点分析了开源框架与 SaaS 服务的优劣，指出数据获取的核心已从'能否抓取'转向'稳定与成本'。FAQ 部分解答了合法性、付费模式及语言支持等常见问题。

涅槃凤凰发布于 2026/3/22更新于 2026/4/208 浏览3 点赞约 29 分钟阅读

C++算法

C++ 红黑树原理与实现详解

深入解析 C++ 红黑树数据结构。介绍了红黑树的基本概念、性质及高度与效率分析。详细阐述了节点结构定义，重点讲解了插入操作的步骤及代码实现，包括变色和旋转逻辑。同时涵盖了查找操作、删除操作概述以及验证红黑树正确性的方法。旨在帮助开发者理解并实现这一自平衡二叉搜索树。

极客零度发布于 2026/3/30更新于 2026/4/2011 浏览1 点赞约 16 分钟阅读

PythonAI算法

常见的 17 种 RAG 方案解析

近年来，随着大语言模型（LLM）的广泛应用，检索增强生成（Retrieval-Augmented Generation，RAG）系统逐渐成为连接私有知识库与智能问答的核心架构。RAG 不仅弥补了大模型在实时性与事实性上的不足，也通过多种技术路径不断演进，形成了丰富的方法体系。基于一份内部技术评估表，系统梳理了当前主流的 RAG 技术路线，并对其核心思路、实现难度与应用场景进行解读。一、基础…

DotNetGuy发布于 2026/4/6更新于 2026/4/20198 浏览182 点赞约 23 分钟阅读

编程语言AI算法

2026 马年春晚 15 个 AI 技术亮点回顾

2026 年春晚展示了 AI 技术的广泛应用，涵盖机器人表演、视觉生成及无障碍服务。宇树科技、松延动力等具身智能企业参与，Seedance 2.0 用于视觉特效，豆包提供语音支持。从 1983 年到 2026 年，春晚互动与技术深度演进，AI 成为核心驱动力。

墨染流年发布于 2026/3/23更新于 2026/4/2017948 浏览208 点赞约 25 分钟阅读

Python大前端算法

Python 实现 3D 模型动态加载的 4 种方法及资源优化

在 Python 中实现 3D 模型动态加载的四种主要方法：基于 PyOpenGL 的底层渲染、VPython 的快速场景构建、ModernGL 的高效 GPU 加速以及 Trimesh 的几何解析。文章详细阐述了各方案的技术栈组成、渲染管线原理及资源优化策略（如 VBO、LOD）。通过对比不同方法的性能与适用场景，为开发者选择合适的 3D 加载方案提供指导，重点强调了内存管理与实时性优化的重要性。

性能调优发布于 2026/3/23更新于 2026/4/20788 浏览662 点赞约 21 分钟阅读

Python大前端算法

企业级 Python 反爬实战：JS 逆向、APP 抓包与验证码破解

介绍企业级爬虫与个人爬虫的差异，涵盖 Web 端 JS 逆向、APP 端抓包及验证码破解等核心难点。通过实战案例拆解工程化、合规化的高可用反爬对抗方案，涉及 SSL Pinning 突破、VM 解混淆等技术点，适用于大规模数据采集场景。

开源信徒发布于 2026/3/24更新于 2026/4/203420 浏览677 点赞约 2 分钟阅读

C++AI算法

YOLOv8 C++部署：OpenCV DNN 实现 V5/V7/V8

介绍使用 OpenCV DNN 模块在 C++ 环境下部署 YOLOv5、YOLOv7 和 YOLOv8 目标检测模型的方法。通过面向对象设计统一基类处理模型加载与预处理，子类实现特定解码逻辑。支持 CPU 与 CUDA 加速，兼容不同版本输出结构差异。包含头文件定义、源文件实现、主函数测试、CMake 构建脚本及 Python 端模型导出流程。实测显示在 RTX 3060 上可达百帧以上推理速度，适用于边缘设备及工业场景。

kaikai发布于 2026/3/30更新于 2026/4/2012 浏览1 点赞约 34 分钟阅读

Python算法

Python 卫星通信模拟：低轨星座的轨道力学计算

使用 Python 进行低轨卫星星座轨道力学计算的完整模拟方法。内容涵盖基础理论（牛顿万有引力、开普勒轨道）、轨道参数与坐标系统、二体问题与摄动模型（J2、大气阻力、太阳辐射压）。文章提供了完整的 Python 代码实现，包括轨道计算类、数值积分器、Walker 星座设计、可见性分析与链路预算工具。此外，还展示了 3D 可视化、并行计算优化及 GPU 加速方案，并通过 Starlink 星座模拟案例验证了框架的有效性。该框架适用于星座设…

云间漫步发布于 2026/3/26更新于 2026/4/2010 浏览5 点赞约 148 分钟阅读

PythonAI算法

Llama Factory 微调常见错误与解决方案

汇总了 Llama Factory 在大模型微调过程中遇到的常见问题及其解决方案，涵盖环境配置、数据准备、训练过程、模型保存加载及 Web UI 问题。提供了具体的排查步骤和优化建议，帮助用户顺利完成微调任务。

字节跳动发布于 2026/4/6更新于 2026/4/2013 浏览4 点赞约 7 分钟阅读