FPGA实现任意角度图像旋转_(图像旋转原理部分)

优质文章学习记录

11 Apr 2026 — 8 min read

1.摘要

书接上回，介绍完Cordic原理部分FPGA实现任意角度图像旋转_（Cordic算法原理部分），和代码FPGA实现任意角度图像旋转_（Cordic算法代码部分），得到了至关重要的正余弦数值就可以进行旋转公式的计算了。

旋转没什么太多原理，看了很多资料感觉是描述的非常复杂，其实本质就是实现两个公式，非整那么多花里胡哨的。所以我就按照我当时的编写思路记录一下。

2.图像旋转代码设计思路

2.1 旋转后的图像尺寸

在一副图像经过旋转后，原本像素的位置肯定会发生变化，图像总的面积虽然保持不变但是各别位置的尺寸会改变，这个应该很好理解。比如一副100x100像素的图像进行旋转，我们只需要获得它的最长距离也就是对角线的尺寸作为旋转后的图像的显示范围。这样无论怎样旋转都能完整显示图像。

如下代码，Pixel_X和Pixel_Y为旋转后图像的尺寸。ROW和COL为原始图像尺寸，利用勾股定理求出对角线的值即可。

reg [12:0] row_size ; reg [12:0] col_size ; assign Pixel_X = row_size ; assign Pixel_Y = col_size ; wire [31:0] cosout_abs = (cosout[31]) ? -cosout : cosout; wire [31:0] sinout_abs = (sinout[31]) ? -sinout : sinout; always @(posedge clk_i, negedge rstn_i) begin if (!rstn_i) begin row_size <= 'd0 ; col_size <= 'd0 ; end else begin // h --> row // w --> col row_size <= (ROW*cosout_abs + COL*sinout_abs) >>14 ; // h col_size <= (COL*cosout_abs + ROW*sinout_abs) >>14 ; // w end end

2.2 旋转后图像的有效位置

这个旋转后的有效位置可以自由设定，我设定的屏幕中心处的位置。具体设计如下：

我用的是一块480*272的lcd屏幕，具体时序网上很多，我用的是野火的。

data_req可以这样理解，以480*272的屏幕中点位置为旋转后图像的中点位置，后面的-5就是看用了几级流水线就减几，只要对齐就好。

//parameter define localparam H_SYNC = 11'd41 , //行同步 H_BACK = 11'd2 , //行时序后沿 H_LEFT = 11'd0 , //行时序左边框 H_VALID = 11'd480 , //行有效数据 H_RIGHT = 11'd0 , //行时序右边框 H_FRONT = 11'd2 , //行时序前沿 H_TOTAL = 11'd525 ; //行扫描周期 localparam V_SYNC = 11'd10 , //场同步 V_BACK = 11'd2 , //场时序后沿 V_TOP = 11'd0 , //场时序左边框 V_VALID = 11'd272 , //场有效数据 V_BOTTOM = 11'd0 , //场时序右边框 V_FRONT = 11'd2 , //场时序前沿 V_TOTAL = 11'd286 ; //场扫描周期 //cnt_h:行扫描计数器 //cnt_v:场扫描计数器 //data_req:数据请求信号 wire data_req = (((cnt_h >= (((H_VALID - Pixel_X)>>1) + H_SYNC + H_BACK - 'd5)) && (cnt_h < (((H_VALID - Pixel_X)>>1) + Pixel_X + H_SYNC + H_BACK - 'd5))) &&((cnt_v >= ((V_VALID - Pixel_Y)>>1) + V_SYNC + V_BACK - 'd5) && ((cnt_v < (((V_VALID - Pixel_Y)>>1) + Pixel_Y + V_SYNC + V_BACK - 'd5)))));

2.3 第一级流水线

没啥好说的么就是在图像有效信号有效时进行行场计数，基本操作。

always @(posedge clk_i, negedge rstn_i) begin if (!rstn_i) r_rotate_valid <= 1'b0 ; else r_rotate_valid <= data_req ; end always @(posedge clk_i, negedge rstn_i) begin if (!rstn_i) r_rotate_end <= 'd0 ; else if (r_rotate_valid && (vcnt == row_abs - 1) && (hcnt == col_abs - 2)) r_rotate_end <= 'd1 ; else r_rotate_end <= 'd0 ; end always @(posedge clk_i, negedge rstn_i) begin if (!rstn_i) hcnt <= 'd0 ; else if (r_rotate_valid && (r_rotate_end || (hcnt == col_abs - 1))) hcnt <= 'd0 ; else if (r_rotate_valid) hcnt <= hcnt + 'd1 ; end always @(posedge clk_i, negedge rstn_i) begin if (!rstn_i) vcnt <= 'd0 ; else if (r_rotate_valid && r_rotate_end) vcnt <= 'd0 ; else if (r_rotate_valid && (hcnt == col_abs - 1)) vcnt <= vcnt + 'd1 ; end

2.4 第二级流水

这里开始计算图像旋转公式了，具体可以看上一篇。

以中心点为起始坐标，相当于坐标系的(0,0)点，这样四个象限的所有坐标点都可以表示出来了。并且按照上图的公式组合起来即可，最终右移14位。

reg signed [12:0] x_cos ; reg signed [12:0] y_sin ; reg signed [12:0] y_cos ; reg signed [12:0] x_sin ; assign row_abs = row_size; assign col_abs = col_size; // 得到旋转后图片的中点 assign row1 = row_abs >> 1 ; assign col1 = col_abs >> 1 ; always @(posedge clk_i, negedge rstn_i) begin if (!rstn_i) x_cos <= 'd0 ; else if(r_rotate_valid_1d) x_cos <= ((hcnt - col1 ) * cosout) >>>14; else x_cos <= x_cos ; end always @(posedge clk_i, negedge rstn_i) begin if (!rstn_i) y_sin <= 'd0 ; else if(r_rotate_valid_1d) y_sin <= ((vcnt-row1 ) * sinout) >>>14; else y_sin <= y_sin ; end always @(posedge clk_i, negedge rstn_i) begin if (!rstn_i) y_cos <= 'd0 ; else if(r_rotate_valid_1d) y_cos <= ((vcnt - row1 ) * cosout) >>>14; else y_cos <= y_cos ; end always @(posedge clk_i, negedge rstn_i) begin if (!rstn_i) x_sin <= 'd0 ; else if(r_rotate_valid_1d) x_sin <= ((hcnt - col1 ) * sinout) >>>14; else x_sin <= x_sin ; end

2.3 第三级流水

同样的，按照2.2图的公式进行排列组合得出旋转后图像映射到原始图像的坐标位置。在这里有几个可能不好理解的地方：原始屏幕坐标(hcnt, vcnt)转换到中心坐标系（减去COL/2和ROW/2）->中心坐标(hcnt - COL/2, vcnt - ROW/2) ->应用旋转公式->旋转后的中心坐标 ->转换回屏幕坐标系（加上COL/2和ROW/2）。

always @(posedge clk_i, negedge rstn_i) begin if (!rstn_i) r_rotate_valid_2d <= 'd0 ; else r_rotate_valid_2d <= r_rotate_valid_1d ; end always @(posedge clk_i, negedge rstn_i) begin if (!rstn_i) hcnt_rotate <= 'd0 ; else if(r_rotate_valid_2d==1'b1) hcnt_rotate <= x_cos - y_sin + (COL>>1 ) ; else hcnt_rotate <= 'd0 ; end always @(posedge clk_i, negedge rstn_i) begin if (!rstn_i) vcnt_rotate <= 'd0 ; else if(r_rotate_valid_2d==1'b1) vcnt_rotate <= y_cos + x_sin + (ROW>>1) ; else vcnt_rotate <= 'd0 ; end

2.4 第四级流水线

hcnt_rotate在0到COL-1之间（在原图像列范围内）
vcnt_rotate在0到ROW-1之间（在原图像行范围内）
已读取的像素数小于图像总像素数（ROW*COL）
每行有COL个像素，所以第vcnt_rotate行的起始地址是COL*vcnt_rotate
再加上该行内的列偏移hcnt_rotate

data_cnt计数器用于限制读取的像素总数不超过原图像的总像素数（ROW*COL）。这是为了防止地址溢出或重复读取。最后机上一个ROM IP核，里面存放着预先处理好的100*100大小的图像数据，生成地址和使能信号读就可以了。ROM读出数据是延迟一个时钟，所以第五级流水就是为了对齐而已。

always @(posedge clk_i, negedge rstn_i) begin if (!rstn_i) r_rotate_valid_3d <= 'd0 ; else r_rotate_valid_3d <= r_rotate_valid_2d ; end always @(posedge clk_i, negedge rstn_i) begin if (!rstn_i) begin rden <= 'd0 ; addra <= 'd0 ; end else if(r_rotate_valid_3d==1'b1) begin if((hcnt_rotate>='d0)&&(hcnt_rotate<COL)&&(vcnt_rotate>='d0)&&(vcnt_rotate<ROW)&&data_cnt<ROW*COL) begin // start_dly3 rden <= 1'b1 ; addra<= COL*vcnt_rotate + hcnt_rotate ; end else begin rden <= 1'b0 ; addra<= 'd0 ; end end else begin rden <= 'd0 ; addra <= 'd0 ; end end always @(posedge clk_i, negedge rstn_i) begin if (!rstn_i) data_cnt <= 'd0 ; else if (data_cnt == ROW*COL - 1) data_cnt <= 'd0 ; else if (r_rotate_valid_3d && (hcnt_rotate>='d0)&&(hcnt_rotate<COL)&&(vcnt_rotate>='d0)&&(vcnt_rotate<ROW)) data_cnt <= data_cnt + 'd1 ; end img_mem_gen img_mem_gen_inst ( .address ( addra ), .clock ( clk_i ), .rden ( rden ), .q ( rom_data ) );

3.仿真结果

30°旋转

图片横着看，逆时钟旋转30°的。

-30°

228°

问题不大，任意角度，任意方向，其它的我就不列举了。

4. 结语

声明一下，采用的开发板是野火征途pro，屏幕也是，lcd显示例程也是他们家的，我在基础上改的。旋转的代码是自己写的，代码肯定是有bug的，后续真正应用到项目肯定是要修改的，这里只是记录一下，感兴趣的可以借鉴一下，有问题的也可以提出我在改。目前总的来看功能是正常的，时序啥的，代码架构我都没搞，语法优化也是随便写的，是草稿版本。

代码放在下一节。

Llama-3.2-3B部署优化：Ollama量化运行与GPU算力适配最佳实践

Llama-3.2-3B部署优化：Ollama量化运行与GPU算力适配最佳实践 1. Llama-3.2-3B模型概述 Llama 3.2是Meta公司推出的新一代多语言大语言模型系列，包含1B和3B两种规模的预训练和指令微调版本。作为纯文本生成模型，Llama-3.2-3B专门针对多语言对话场景进行了深度优化，在代理检索、内容摘要等任务中表现卓越。该模型采用改进的Transformer架构，通过自回归方式进行文本生成。指令微调版本结合了有监督微调（SFT）和人类反馈强化学习（RLHF）技术，确保模型输出既符合人类偏好，又具备高度的安全性和实用性。在多项行业标准测试中，Llama-3.2-3B的表现超越了众多开源和闭源聊天模型。 2. Ollama环境快速部署 2.1 系统要求与安装 Ollama支持多种操作系统环境，以下是推荐配置：最低配置要求： * 操作系统：Ubuntu 20.04+ / Windows 10+ / macOS 12+ * 内存：8GB RAM（16GB推荐） * 存储：10GB可用空间 * GPU：

VS Code Copilot 完整使用教程（含图解）

一、GitHub Copilot 概述 GitHub Copilot 是一款集成在 Visual Studio Code 中的 AI 驱动编码助手，它基于公共代码仓库训练而成，能够支持大多数编程语言和框架。通过自然语言提示和现有代码上下文，Copilot 可提供实时代码建议、解释说明和自动化实现，显著提升开发效率。核心功能亮点 * 智能代码补全：输入时提供单行到整函数级别的实时建议，支持多种编程语言 * 自主编码模式（Agent Mode）：根据自然语言指令，自动规划并执行复杂开发任务，跨文件协调修改 * 自然语言交互：通过聊天界面与代码库对话，提问、解释代码或指定修改需求 * 多文件批量修改：单个指令即可应用更改到项目中多个文件，AI 会分析项目结构并进行协调修改 * 模型灵活切换：可根据速度、推理能力或特定任务需求切换不同 AI 模型，支持接入外部模型二、安装与设置步骤获取访问权限不同用户类型需通过以下方式获取 Copilot 访问权限：

不止脑洞！移动云AIGC大赛正式启幕

未来，是什么样子的？是穿梭云端的智慧城市还是人与AI共舞的创意工坊？是赛博街区的霓虹闪烁还是治愈系森林里的数字精灵？当生活插上科技的翅膀从智慧城市的精细运转到数字生活的便捷体验每一份改变世界的想象力都值得被AI托举这一次，我们诚挚邀请你—— 把你脑海中的“智能新空间”变成现实用移动云做创作引擎发挥最天马行空的创想让想象力不再停留于脑海让创意被看见、被喝彩、被珍藏十大创作主题：为你的灵感指明方向本次大赛围绕移动云赋能的重点行业，设置十大创作主题：请从以上主题中选择你感兴趣的方向进行创作描绘你心中的智能新空间。 *超出以上主题范围的作品，将不纳入本次大赛评选。三步快速参与从灵感到作品，从作品到出圈 STP1：一键上云·灵感即现选择你感兴趣的主题方向进入移动云绘制心中的“智能新空间” 畅想千行百业的数智体验 STEP2：云端晒作，即刻破圈作品出炉？即刻分享！任选一种方式让创意出圈带话题#移动云智能新空间AIGC大赛# 发微博/抖音并@

Llama-Factory能否用于地理信息查询？智慧城市公共服务

Llama-Factory 能否用于地理信息查询？——解锁智慧城市公共服务的语义之门在一座千万级人口的城市里，每天都有成千上万的人在问：“最近的发热门诊在哪？”“暴雨预警下我家是否处于低洼易涝区？”“去政务大厅办社保要走哪条路最省时间？”这些问题看似简单，却对城市的响应速度和智能化水平提出了极高要求。传统的搜索系统依赖关键词匹配，面对“打疫苗的地方”和“接种点”这类表达差异常常束手无策；而通用大模型虽然能“聊天”，但在具体城市空间结构、行政区划层级、公共服务分布等专业领域知识上往往“答非所问”。有没有一种方式，能让AI既懂语言，又懂地图？答案是肯定的——通过领域微调，我们可以让大模型真正“扎根城市”。而在这个过程中，Llama-Factory 正成为一个不可忽视的技术支点。从“会说话”到“懂城市”：为什么需要定制化微调？通用大语言模型如 Qwen、Baichuan 或 LLaMA 系列，在海量文本上预训练后具备了强大的语言生成能力，但它们并不天然理解“朝阳区”是一个行政区域，“三甲医院”意味着特定医疗资质，也不清楚“