人工智能:深度学习中的卷积神经网络(CNN)实战应用

人工智能:深度学习中的卷积神经网络(CNN)实战应用

人工智能:深度学习中的卷积神经网络(CNN)实战应用

在这里插入图片描述

1.1 本章学习目标与重点

💡 学习目标:掌握卷积神经网络的核心原理、经典网络架构,以及在图像分类任务中的实战开发流程。
💡 学习重点:理解卷积层、池化层的工作机制,学会使用 TensorFlow 搭建 CNN 模型并完成训练与评估。

1.2 卷积神经网络核心原理

1.2.1 卷积层:提取图像局部特征

💡 卷积层是 CNN 的核心组件,其作用是通过卷积核对输入图像进行局部特征提取。
卷积核本质是一个小型的权重矩阵。它会按照设定的步长在图像上滑动。每滑动一次,卷积核就会与对应区域的像素值做内积运算,输出一个特征值。
这个过程可以捕捉图像的边缘、纹理等基础特征。
⚠️ 注意:卷积核的数量决定了输出特征图的通道数,数量越多,提取的特征维度越丰富。

① 定义一个 3×3 大小的卷积核,步长设为 1,填充方式为 SAME
② 对 28×28 单通道的手写数字图像进行卷积操作
③ 输出特征图的尺寸保持 28×28,通道数由卷积核数量决定

import tensorflow as tf from tensorflow.keras.layers import Conv2D # 定义卷积层 conv_layer = Conv2D(filters=32, kernel_size=(3,3), strides=(1,1), padding="SAME", input_shape=(28,28,1))# 模拟输入:1 张 28×28 单通道图像 input_image = tf.random.normal(shape=(1,28,28,1))# 执行卷积运算 output_feature = conv_layer(input_image)print("输出特征图形状:", output_feature.shape)

1.2.2 池化层:降低特征维度与防止过拟合

💡 池化层的作用是对卷积层输出的特征图进行降采样。它可以在保留关键特征的同时,减少参数数量和计算量。
常见的池化方式有两种:最大池化平均池化
最大池化选取局部区域内的最大值作为输出,能更好保留纹理特征。平均池化选取局部区域的平均值,能保留背景特征。

① 定义 2×2 大小的最大池化层,步长设为 2
② 对卷积层输出的特征图进行池化操作
③ 输出特征图的尺寸会缩小为原来的 1/2

from tensorflow.keras.layers import MaxPooling2D # 定义最大池化层 pool_layer = MaxPooling2D(pool_size=(2,2), strides=(2,2), padding="SAME")# 对卷积层输出的特征图做池化 pool_output = pool_layer(output_feature)print("池化后特征图形状:", pool_output.shape)

1.3 经典 CNN 架构——LeNet-5

💡 LeNet-5 是由 Yann LeCun 提出的经典卷积神经网络。它专门用于手写数字识别任务,奠定了现代 CNN 的基础架构。
LeNet-5 的结构分为 5 层:2 个卷积层、2 个池化层、1 个全连接层,最后通过 Softmax 输出分类结果。

1.3.1 LeNet-5 网络结构搭建

from tensorflow.keras import Sequential from tensorflow.keras.layers import Flatten, Dense # 搭建 LeNet-5 模型 lenet5 = Sequential([# 卷积层 1:6 个 5×5 卷积核,步长 1,无填充 Conv2D(filters=6, kernel_size=(5,5), strides=(1,1), padding="VALID", input_shape=(28,28,1), activation="tanh"),# 池化层 1:2×2 最大池化,步长 2 MaxPooling2D(pool_size=(2,2), strides=(2,2), padding="VALID"),# 卷积层 2:16 个 5×5 卷积核,步长 1,无填充 Conv2D(filters=16, kernel_size=(5,5), strides=(1,1), padding="VALID", activation="tanh"),# 池化层 2:2×2 最大池化,步长 2 MaxPooling2D(pool_size=(2,2), strides=(2,2), padding="VALID"),# 展平层:将特征图转为一维向量 Flatten(),# 全连接层 1:120 个神经元 Dense(units=120, activation="tanh"),# 全连接层 2:84 个神经元 Dense(units=84, activation="tanh"),# 输出层:10 个神经元对应 10 个数字类别,Softmax 激活 Dense(units=10, activation="softmax")])# 查看模型结构 lenet5.summary()

1.3.2 LeNet-5 模型编译与训练

💡 本次实战使用 MNIST 手写数字数据集。这个数据集包含 60000 张训练图像和 10000 张测试图像,每张图像都是 28×28 的灰度图。

① 加载 MNIST 数据集并进行归一化处理
② 编译模型:选择 Adam 优化器、交叉熵损失函数
③ 训练模型:设置批次大小 32,训练轮数 10 轮

from tensorflow.keras.datasets import mnist from tensorflow.keras.utils import to_categorical # 1. 加载并预处理数据(x_train, y_train),(x_test, y_test)= mnist.load_data()# 归一化:将像素值从 0-255 转为 0-1 x_train = x_train /255.0 x_test = x_test /255.0# 增加通道维度:(样本数, 28, 28) → (样本数, 28, 28, 1) x_train = tf.expand_dims(x_train, axis=-1) x_test = tf.expand_dims(x_test, axis=-1)# 标签独热编码 y_train = to_categorical(y_train, num_classes=10) y_test = to_categorical(y_test, num_classes=10)# 2. 编译模型 lenet5.compile(optimizer="adam", loss="categorical_crossentropy", metrics=["accuracy"])# 3. 训练模型 history = lenet5.fit(x_train, y_train, batch_size=32, epochs=10, validation_split=0.1)# 4. 评估模型 test_loss, test_acc = lenet5.evaluate(x_test, y_test)print(f"测试集准确率:{test_acc:.4f}")

1.4 实战问题与解决方案

1.4.1 过拟合问题处理

⚠️ 问题:训练过程中,训练集准确率持续上升,但验证集准确率出现下降。这就是过拟合现象。
💡 解决方案:加入Dropout 层随机丢弃部分神经元,防止模型过度依赖某些特征。

在全连接层后加入 Dropout 层的示例代码:

from tensorflow.keras.layers import Dropout # 修改模型,加入 Dropout 层 lenet5_with_dropout = Sequential([ Conv2D(6,(5,5), strides=1, padding="VALID", input_shape=(28,28,1), activation="tanh"), MaxPooling2D((2,2), strides=2, padding="VALID"), Conv2D(16,(5,5), strides=1, padding="VALID", activation="tanh"), MaxPooling2D((2,2), strides=2, padding="VALID"), Flatten(), Dense(120, activation="tanh"), Dropout(0.2),# 丢弃 20% 的神经元 Dense(84, activation="tanh"), Dropout(0.2), Dense(10, activation="softmax")]) lenet5_with_dropout.compile(optimizer="adam", loss="categorical_crossentropy", metrics=["accuracy"])

1.4.2 模型优化技巧

💡 技巧 1:使用ReLU 激活函数替换 tanh 函数。ReLU 能缓解梯度消失问题,加速模型收敛。
💡 技巧 2:使用批量归一化(BatchNormalization)。它可以使每一层的输入分布更稳定,提升训练效率。
💡 技巧 3:调整学习率。使用学习率衰减策略,在训练后期降低学习率,让模型更精准收敛。

1.5 本章总结

✅ 卷积层通过卷积核提取图像局部特征,池化层通过降采样减少参数与计算量。
✅ LeNet-5 是经典 CNN 架构,由卷积层、池化层、全连接层组成,适用于小尺寸图像分类。
✅ 实战中可通过加入 Dropout 层、使用 ReLU 激活函数等方法优化模型,提升泛化能力。

Read more

26年网络建设与运维样题一的网络建设与调试模块完整配置方案(深一职-华为)

26年网络建设与运维样题一的网络建设与调试模块完整配置方案(深一职-华为)

模块一:网络建设与调试 任务描述: 某集团公司原在城市A成立了总公司,后在城市B成立了分公司,又在城市 C 建立了办事处。集团设有产品、营销、法务、财务、人力5 个部门,统一进行 IP 及业务资源的规划和分配,全网采用 OSPF、 RIP、ISIS、BGP 路由协议进行互联互通。 随着企业数字化转型工作进一步推进,为持续优化运营创新,充分激活数据要素潜能,为社会创造更多价值,集团决定在总公司建立两个数据中心,在某省建立异地灾备数据中心,以达到快速、可靠交换数据,增强业务部署弹性的目的,完成向两地三中心整体战略架构演进,更好的服务于公司客户。 网络拓扑图: 模块一网络建设与调试 完整配置方案 本配置方案基于赛题要求,涵盖交换配置、路由调试、策略调试三大核心部分,采用华为设备命令行体系(大赛主流设备体系),按赛题要求完成所有配置项,同时附关键解析说明。 通用前提配置 所有设备先完成基础初始化: sysname 设备名 // 如CE-1、

By Ne0inhk
时序数据库选型革命:深入解析Apache IoTDB的架构智慧与实战指南

时序数据库选型革命:深入解析Apache IoTDB的架构智慧与实战指南

目录 引言:时序数据时代的到来 第一章 时序数据的独特魅力与挑战 1.1 时序数据的"个性特征" 1.2 时序数据管理的"技术大山" 第二章 时序数据库的"心脏"——存储引擎 2.1 架构演进:从通用到专用 2.2 IoTDB的创新存储设计 第三章 选型的"金标准"——关键指标详解 3.1 性能指标:数据库的"体能测试" 3.2 功能完备性:数据库的"技能树"

By Ne0inhk
深入理解 Linux 基础 IO:从 C 库到系统调用的完整剖析

深入理解 Linux 基础 IO:从 C 库到系统调用的完整剖析

🔥个人主页:Cx330🌸 ❄️个人专栏:《C语言》《LeetCode刷题集》《数据结构-初阶》《C++知识分享》 《优选算法指南-必刷经典100题》《Linux操作系统》:从入门到入魔 《Git深度解析》:版本管理实战全解 🌟心向往之行必能至 🎥Cx330🌸的简介: 目录 前言: 一、理解 “文件” 二、温故知新:C 标准库的文件 IO 操作  2.1 C语言文件操作常用函数 2.2 文件写入:fwrite(附加其他函数) 2.3 文件读取:fread(附加其他函数) 2.4 标准输入输出:stdin、stdout、stderr 三、走进内核:文件相关的系统调用接口 3.

By Ne0inhk
基于AWS SDK S3EndpointProvider实现MinIO集群智能负载均衡

基于AWS SDK S3EndpointProvider实现MinIO集群智能负载均衡

🧑 博主简介:ZEEKLOG博客专家,历代文学网(PC端可以访问:https://literature.sinhy.com/#/?__c=1000,移动端可关注公众号 “ 心海云图 ” 微信小程序搜索“历代文学”)总架构师,16年工作经验,精通Java编程,高并发设计,分布式系统架构设计,Springboot和微服务,熟悉Linux,ESXI虚拟化以及云原生Docker和K8s,热衷于探索科技的边界,并将理论知识转化为实际应用。保持对新技术的好奇心,乐于分享所学,希望通过我的实践经历和见解,启发他人的创新思维。在这里,我希望能与志同道合的朋友交流探讨,共同进步,一起在技术的世界里不断学习成长。 🤝商务合作:请搜索或扫码关注微信公众号 “ 心海云图 ” 基于AWS SDK S3EndpointProvider实现MinIO集群智能负载均衡 前言 在现代分布式存储系统中,对象存储已成为存储海量非结构化数据的首选方案。MinIO作为一款高性能、云原生的对象存储系统,以其与AWS S3 API的完美兼容性而广受欢迎。然而,在生产环境中,单一MinIO节点往往无法满足高可用和高

By Ne0inhk