从点不亮LED到做出图像系统：我的 FPGA 学习路径复盘

优质文章学习记录

08 Apr 2026 — 4 min read

一年前，我还在为一个简单的流水灯上板失败而焦头烂额。
仿真波形完美，开发板毫无反应——查了三天，最后发现是约束文件里漏了一个引脚定义。

如今回头看，FPGA 学习最难的从来不是 Verilog 语法，而是如何把零散的知识拼成一个能跑起来的系统。
这篇文章，是我对自己两年学习过程的一次梳理，希望能给正在路上的你一点参考。

新手最容易卡住的三个地方

硬件环境搭建成本高、试错周期长
买板子只是开始，驱动、电源、外设兼容性……很多时间花在了非核心问题上。
学了一堆知识点，却做不出完整功能
看得懂状态机，也写过 UART，但一整合就出问题——因为没人教你怎么“搭系统”。
调试无从下手
“仿真对，上板错”是常态。跨时钟域、时序违例、信号完整性……这些概念只有在真实项目中踩过坑，才真正理解。

我的四阶段进阶思路

阶段一：先理解“硬件是怎么工作的”

别急着写复杂逻辑。用最简单的例子建立直觉：

用计数器控制 LED 闪烁频率
用组合逻辑实现按键直接控制输出
观察 Vivado/Quartus 综合后的 RTL 视图，看代码如何映射为电路

工具建议：选定一个平台（Xilinx 或 Intel）深入使用，别来回切换。

阶段二：在板子上跑通基础外设

我做的第一批实验包括：

按键消抖 + LED 反馈（理解同步与毛刺）
数码管动态扫描（掌握分时复用）
UART 串口收发（学习波特率生成、跨时钟同步）
I²C 读取温湿度传感器（熟悉协议时序）

每个实验我都尝试修改参数、更换外设，确保不是“照抄能跑”，而是“理解后能改”。

阶段三：主动接触工程级技能点

当基础稳固后，我开始挑战：

时序约束：让设计稳定运行在 100MHz 以上
千兆以太网接口（GMII/RGMII）
简单图像处理算法（如 Sobel 边缘检测）

这些内容看似高阶，但拆解后其实有清晰的学习路径。比如时序问题，80% 出在异步信号未打拍或复位释放不同步。

阶段四：完成一个端到端的小系统

我的第一个完整项目是：摄像头采集 → 图像预处理 → VGA 显示。
虽然功能简单，但它让我走完了从需求分析、模块划分、仿真验证到上板调试的完整流程。这个项目后来也成为我面试时最有话说的作品。

关于学习方式的一点反思

早期我完全靠自学，进度很慢。后来有机会在一个有工程师带的小团队里集中实操，每周动手做项目、现场调 bug。

最大的变化是：问题不再积压。
以前一个时序违例能卡我一周，后来有人一句话点醒：“你复位释放是不是没同步？”——当天就解决了。

这种“即时反馈 + 真实硬件 + 同伴讨论”的环境，对我帮助极大。
它让我意识到：FPGA 不是“看会”的，是“做会”的，而有人带，真的能少走很多弯路。

写在最后

如果你也在自学 FPGA，或许会经历和我一样的迷茫期。
我想说的是：卡住很正常，放弃才可惜。
只要坚持“写代码 → 上板 → 调试 → 反思”的循环，哪怕慢一点，也能稳稳前进。

目前我在持续参与 FPGA 相关的项目实践，也乐于和同行交流学习中的具体问题。
如果你看到这里，欢迎私信交流，或者留言聊聊你的 FPGA 故事。

—— 一起把硬件玩明白。

标签：#FPGA #Verilog #数字电路 #硬件工程师 #嵌入式开发 #Vivado #Quartus #FPGA入门 #工程实践 #学习复盘

Stable Diffusion 3.5 FP8支持多卡并行吗？实测双GPU扩展性表现

Stable Diffusion 3.5 FP8 支持多卡并行吗？实测双GPU扩展性表现在生成式AI进入工业化部署的今天，一个核心问题摆在每一个MLOps工程师面前：如何让像 Stable Diffusion 3.5 这样的大模型，在保持高质量输出的同时，真正跑得快、压得小、扩得开？ 2024年发布的 stable-diffusion-3.5-fp8 镜像正是朝着这个方向迈出的关键一步。它不再只是“能用”的开源模型，而是开始向“好用”、“高效”、“可规模化”演进的技术产品。尤其是其对 FP8量化的支持，引发了社区广泛讨论——但这还不够。更关键的问题是：这个FP8版本能不能稳稳地跑在双GPU上？多卡扩展性能否扛住生产压力？我们带着这个问题，结合官方技术文档、Hugging Face生态工具链以及实际硬件测试（双NVIDIA L40S + NVLink），深入拆解了SD3.5 FP8的底层机制与部署表现。 FP8

蓝耘智算 + 通义万相 2.1：为 AIGC 装上 “智能翅膀”，翱翔创作新天空

1. 引言：AIGC 的崛起与挑战在过去几年中，人工智能生成内容（AIGC）技术突飞猛进。AIGC 涉及了文本生成、图像创作、音乐创作、视频制作等多个领域，并逐渐渗透到日常生活的方方面面。传统的内容创作方式已经被许多人类创作者所推崇，但随着时间的推移，人工智能的出现使得创作的边界变得更加模糊。然而，尽管人工智能技术取得了巨大进展，如何高效地将 AI 模型与计算平台结合，以便为 AIGC 提供更加高效、智能的支持，仍然是一个关键问题。蓝耘智算与通义万相 2.1 的结合为解决这一问题提供了新的方向。这种创新的技术融合使得 AIGC 可以不仅仅依赖于数据处理的能力，还可以实现智能化的生成和创作，推动内容创作的未来。 2. 蓝耘智算：为 AIGC 提供智能支持 2.1 蓝耘智算简介蓝耘智算是一种综合性计算平台，专注于为大规模人工智能应用提供优化计算资源。在过去几年中，蓝耘智算不断发展壮大，已成为许多行业中的顶尖计算平台之一，广泛应用于机器学习、

零代码体验AI写作：Qwen2.5-32B-Instruct网页版直接调用

零代码体验AI写作：Qwen2.5-32B-Instruct网页版直接调用你是否试过在浏览器里点几下，就让一个320亿参数的大模型为你写方案、改文案、理逻辑、编报告？不用装环境、不写代码、不配GPU——连终端都不用打开。这次我们不聊本地部署、不讲Docker编排、不碰vLLM配置。我们就用最轻的方式，把Qwen2.5-32B-Instruct这个当前中文能力顶尖的开源大模型，直接“请”进你的浏览器里，像用搜索引擎一样提问，像发微信一样获得专业级文字输出。这不是概念演示，而是真实可用的网页服务；不是简化阉割版，而是完整支持128K上下文、8K长文本生成、结构化数据理解与JSON输出的原生能力。它背后跑的是Ollama轻量推理框架，但对你来说——只有输入框和回车键。下面带你全程零门槛上手，从打开页面到写出第一段可商用文案，5分钟搞定。 1. 为什么是Qwen2.5-32B-Instruct？它到底强在哪先说结论：它不是“又一个大模型”，而是目前开源生态中，中文理解+逻辑表达+工程落地能力最均衡的32B级选手。我们不堆参数，只看你能用它做什么。 1.1

node-llama-cpp安装与配置：Windows、Linux和Mac全平台教程

node-llama-cpp安装与配置：Windows、Linux和Mac全平台教程【免费下载链接】node-llama-cppRun AI models locally on your machine with node.js bindings for llama.cpp. Force a JSON schema on the model output on the generation level 项目地址: https://gitcode.com/gh_mirrors/no/node-llama-cpp node-llama-cpp是一个基于llama.cpp的Node.js绑定库，让你能够在本地机器上运行AI模型，并在生成级别强制模型输出符合JSON模式。本文将为你提供Windows、Linux和Mac全平台的安装与配置教程，帮助你快速上手这款强大的AI工具。一、准备工作在开始安装node-llama-cpp之前，请确保你的系统满足以下要求：