DeepFace深度学习库+OpenCV实现——情绪分析器

DeepFace深度学习库+OpenCV实现——情绪分析器

目录

应用场景

实现组件

1. 硬件组件

2. 软件库与依赖

3. 功能模块

代码详解(实现思路)

导入必要的库

打开摄像头并初始化变量

主循环

FPS计算

情绪分析及结果展示

显示FPS和图像

退出条件

​编辑

完整代码

效果展示

自然的

开心的

伤心的

恐惧的

惊讶的



 效果展示

自然的

开心的

伤心的

恐惧的

惊讶的


 



应用场景

        应用场景比较广泛,尤其是在需要了解和分析人类情感反应的场合。:

  1. 心理健康评估:在心理健康领域,可以通过长期监控和分析一个人的情绪变化来辅助医生进行诊断或治疗效果评估。
  2. 用户体验研究:在产品设计、广告制作或网站开发过程中,通过观察用户在使用过程中的情绪反应,来优化产品的用户体验。
  3. 互动娱乐:在游戏或虚拟现实应用中,根据玩家的情绪状态动态调整游戏难度或故事情节,以增加沉浸感和互动性。
  4. 安全监控:在公共安全领域,通过情绪识别技术可以早期发现异常行为或潜在威胁,例如在机场安检区域或者大型公共活动场所。
  5. 教育与培训:帮助教师了解学生在学习过程中的情绪状态,以便及时调整教学方法;也可用于职业培训中,通过模拟不同情境下的情绪反应来进行针对性训练。
  6. 智能助手:集成到智能家居系统或个人助理设备中,让设备能够感知用户的情绪状态,并据此提供更加个性化的服务或响应。
  7. 疲劳驾驶预测:对于司机情绪的分析,可以监控和作为一种影响因子判断出出司机的驾驶状态,以至于安全的驾驶。

        总之,随着人工智能技术的发展,情绪识别作为一种重要的交互方式,在许多领域都有着巨大的潜力和广阔的应用前景。


实现组件

1. 硬件组件

  • 摄像头:用于捕捉实时视频流,通常为电脑内置的摄像头或外接USB摄像头。

2. 软件库与依赖

  • OpenCV (cv2):一个开源的计算机视觉和机器学习软件库。它提供了大量的图像处理和计算机视觉算法,这里主要用于捕获摄像头视频流、处理图像以及在图像上绘制矩形框和文字。
  • time:Python标准库的一部分,用于计算时间间隔,进而计算FPS(每秒帧数)。
  • numpy (np):虽然在这段代码中没有直接使用,但它是进行科学计算的基础库,通常与OpenCV一起用于更复杂的图像处理任务。
  • DeepFace:这是一个深度学习库,专门用于面部识别及其相关任务(如年龄、性别、情绪等属性的预测)。在这个应用中,DeepFace被用来对每一帧视频中的人脸进行情绪分析。

3. 功能模块

  • 视频捕捉与处理模块
    • 使用cv2.VideoCapture(0)打开摄像头,并通过循环不断读取视频帧。
    • 对每一帧图像进行处理,包括计算FPS、进行情绪分析以及在图像上标注结果。
  • FPS计算模块
    • 利用time.time()获取当前时间戳,通过计算连续两帧之间的时间差来计算瞬时FPS,并采用滑动平均方法平滑FPS值。
  • 情绪分析模块
    • 调用DeepFace.analyze()函数对每一帧中的所有人脸进行情绪分析。分析结果包含每个人脸的位置、主导情绪及置信度。
  • 结果显示模块
    • 使用OpenCV提供的绘图函数(如cv2.rectangle()cv2.putText())在视频帧上标记出人脸位置、显示情绪信息及置信度,并展示当前的FPS值。
  • 用户交互模块
    • 通过监听键盘输入(cv2.waitKey(1)),允许用户按下q键退出程序。

代码详解(实现思路)

        主要是通过摄像头捕捉实时视频流,然后使用深度学习模型对捕捉到的每一帧进行情绪分析,然后在视频上标记出检测到的情绪和置信度,并显示当前的FPS(每秒帧数)。下面是对代码各个部分的详细解释:

导入必要的库

import cv2 import time import numpy as np from deepface import DeepFace
  • cv2:OpenCV库,用于处理图像和视频流。
  • time:用于计算时间间隔,进而计算FPS。
  • numpy:虽然在这段代码中没有直接使用,但通常与OpenCV一起用于图像处理。
  • DeepFace:一个基于深度学习的面部识别和分析库。

打开摄像头并初始化变量

cap = cv2.VideoCapture(0) prev_time = time.time() fps = 0 alpha = 0.9
  • cv2.VideoCapture(0):打开默认摄像头(0代表第一个摄像头设备)。
  • prev_time 和 fps:用于计算FPS的变量。prev_time保存上一帧的时间戳,而fps保存当前帧率。
  • alpha:用于滑动平均计算FPS的权重值。

主循环

while True: ret, frame = cap.read() if not ret: break ... cap.release() cv2.destroyAllWindows()
  • 这个无限循环不断从摄像头读取帧(cap.read())。如果读取失败(ret为False),则退出循环。
  • 循环体内部实现了帧的获取、FPS计算、情绪分析、结果绘制以及画面显示。
FPS计算
current_time = time.time() delta_time = current_time - prev_time prev_time = current_time if delta_time > 0: instant_fps = 1.0 / delta_time fps = alpha * fps + (1 - alpha) * instant_fps
  • 计算自上次迭代以来经过的时间(delta_time),然后根据这个时间差计算瞬时FPS(instant_fps)。
  • 使用滑动平均更新总体FPS(fps)。
情绪分析及结果展示
result = DeepFace.analyze(frame, actions=['emotion'], enforce_detection=False) ...
  • 对每一帧调用DeepFace.analyze()方法进行情绪分析。actions=['emotion']指定只执行情绪分析。
  • 遍历返回的结果,在画面上标出人脸的位置(cv2.rectangle)和识别出的情绪信息(cv2.putText)。
显示FPS和图像
cv2.putText(frame, f'FPS: {fps:.2f}', (10, 30), cv2.FONT_HERSHEY_SIMPLEX, 0.7, (0, 255, 255), 2) cv2.imshow("Emotion Detection", frame)
  • 在图像上显示当前的FPS。
  • 使用cv2.imshow()显示带有标注的图像。
退出条件
if cv2.waitKey(1) & 0xFF == ord('q'): break
  • 如果按下键盘上的q键,则退出循环结束程序。

最后,释放摄像头资源(cap.release())并关闭所有窗口(cv2.destroyAllWindows())。


完整代码

import cv2 import time import numpy as np from deepface import DeepFace # 打开摄像头 cap = cv2.VideoCapture(0) # FPS 计算参数 prev_time = time.time() fps = 0 alpha = 0.9 # 滑动平均权重,数值越大,FPS 越平稳 while True: ret, frame = cap.read() if not ret: break # 计算 FPS current_time = time.time() delta_time = current_time - prev_time prev_time = current_time if delta_time > 0: instant_fps = 1.0 / delta_time fps = alpha * fps + (1 - alpha) * instant_fps # 计算滑动平均 FPS try: # 进行表情识别 result = DeepFace.analyze(frame, actions=['emotion'], enforce_detection=False) for face in result: x, y, w, h = face['region']['x'], face['region']['y'], face['region']['w'], face['region']['h'] emotion = face['dominant_emotion'] confidence = face['emotion'][emotion] # 获取表情的置信度 # 绘制人脸矩形框 cv2.rectangle(frame, (x, y), (x + w, y + h), (0, 255, 0), 2) # 在人脸上方显示情绪信息 text = f'{emotion} ({confidence:.2f}%)' cv2.putText(frame, text, (x, y - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.6, (0, 255, 0), 2) except Exception as e: print("无法检测到人脸:", e) # 显示 FPS(平滑更新) cv2.putText(frame, f'FPS: {fps:.2f}', (10, 30), cv2.FONT_HERSHEY_SIMPLEX, 0.7, (0, 255, 255), 2) # 显示图像 cv2.imshow("Emotion Detection", frame) if cv2.waitKey(1) & 0xFF == ord('q'): break cap.release() cv2.destroyAllWindows() 

总结

        核心在于结合了OpenCV进行视频处理和DeepFace进行面部情绪分析的能力。通过这些组件,实现从摄像头实时捕捉视频、分析视频中人物的情绪状态并在视频画面上直观地展示分析结果的功能。

        这不仅展示了如何利用现有的AI库快速构建实用的应用程序,也为进一步开发基于情感识别的复杂系统提供了基础框架或者是组件。

Read more

【前端实战】构建 Vue 全局错误处理体系,实现业务与错误的清晰解耦

【前端实战】构建 Vue 全局错误处理体系,实现业务与错误的清晰解耦

目录 【前端实战】构建 Vue 全局错误处理体系,实现业务与错误的清晰解耦 一、为什么要做全局错误处理? 1、将业务逻辑与错误处理解耦 2、为监控和埋点提供统一入口 二、Vue 中的基础全局错误处理方式 1、Vue 中全局错误处理写法 2、它会捕获哪些错误? 3、它不会捕获哪些错误? 4、errorHandler 的参数含义 三、全局错误处理的进阶设计 1、定义“可识别的业务错误” 2、在 errorHandler 中做真正的“分类处理” 3、补齐 Promise reject 的捕获能力 4、错误处理的策略化封装 四、结语         作者:watermelo37         ZEEKLOG优质创作者、华为云云享专家、阿里云专家博主、腾讯云“

By Ne0inhk

前端数据库 IndexedDB 详解:构建强大的离线Web应用

前端数据库 IndexedDB 详解:构建强大的离线Web应用 * 引言:为什么需要前端数据库? * IndexedDB核心概念解析 * 1. 数据库(Database) * 2. 对象存储(Object Store) * 3. 索引(Index) * 4. 事务(Transaction) * 5. 游标(Cursor) * 完整代码示例:实现一个联系人管理器 * 1. 初始化数据库 * 2. 添加联系人 * 3. 查询联系人 * 通过ID查询 * 通过索引查询 * 4. 更新联系人 * 5. 删除联系人 * 6. 高级查询:使用游标和范围 * IndexedDB最佳实践 * IndexedDB的浏览器支持情况 * 使用第三方库简化开发 * 常见应用场景 * 总结 引言:为什么需要前端数据库? 在现代Web开发中,我们经常需要处理大量结构化数据。传统的localStorage和sessionStorage虽然简单易用,

By Ne0inhk
Java算法OJ(10)哈希表练习

Java算法OJ(10)哈希表练习

目录 1.前言 2.正文 2.1俩数之和 2.2无重复字符的最长子串 2.3罗马数字转整数 2.4整数转罗马数字 3.小结 1.前言 哈喽大家好吖,今天来分享几道哈希表相关的练习题,操作比较基础但是思想比较重要,另外有许多思路与解法都是学习参照题解中诸位大佬的做法,都很有思路对我们很有启发性,欢迎大家在评论区多多交流,废话不多说让我们直接开始吧。 2.正文 2.1俩数之和 提交链接: 1. 两数之和 - 力扣(LeetCode)https://leetcode.cn/problems/two-sum/description/?envType=problem-list-v2&envId=hash-table 这道题当然无脑遍历肯定能直接解出来,但既然要锻炼哈希表的熟练程度就用HashSet来完成: 先初始化该哈希表。遍历,如果存在一个数组的数,

By Ne0inhk
【贪心算法-第三弹——Leetcode-179.最大数】

【贪心算法-第三弹——Leetcode-179.最大数】

1.题目解析 题目来源 测试用例  2.算法原理  3.实战代码 代码解析  *4.贪心策略的合理性证明(离散数学——全序关系) 完全性 反对称性 传递性  1.题目解析 题目来源 测试用例  2.算法原理  I.由题目我们知道需要返回将数组的所以数字组合形成的一个最大的数字,所以我们可以将整数类型转化为字符串,这样便于运算 II.这里如果使用暴力解法就是从前到后将每个数字高位值更大的排到前面然后不断遍历组合字符串即可,但是这样时间复杂度会很大,不妨使用贪心的思路,这里"贪心"的思路是: III.需要注意的是当数组中全部是0的情况,此时我们理想的返回值就是一个字符"0",但是如果不特殊处理上述逻辑就返回的是类似"00000"这样的情况,显然不行。所以我们在最后要判断字符串的首位元素是否为"0&

By Ne0inhk