动态手势控制音频播放器(一)总体方案设计
基于计算机视觉的动态手势识别系统能够对于动态手势的移动进行识别,通过摄像头实时采集图片,将每一帧图片进行图像处理,并进行手部检测,一旦检测到目标,开始建立运动轨迹图,当手部移动时间达到八帧,则运动轨迹图建立完成并进行识别运动方向。为了解决手部往回动作出现“徘徊”问题,规定在识别到一个动作之后需要从中心移动,否则,不会进行手势检测与识别操作。

引言

    随着科学技术的飞速发展,人机交互方式也不断改变。从古老的命令行方式到图形界面交互方式,再到触摸屏交互方式。人机交互方式不断往自然、方便、直观、以用户为中心的方向去改变,而不再以设备为中心的传统交互方式如键盘、鼠标等设备。

    手势自古以来在人类交流方面扮演着非常重要的角色。因此,通过手势进行人机交互方式也受到极大的欢迎并已经使用到生活当中。2023年荣耀发布了Magic系列的一款移动电话产品Magic5。该产品具有了隔空手势的人机交互方式,无需接触手机,既可用手势隔空操控屏幕,上下挥手就能滑动屏幕,手掌抓握即可轻松截屏。这个交互方式方便我们操控手机。因此,手势交互应用有可能在未来成为主流交互方式。所以,越来越多的研究者也将目光投在了人机交互的手势识别方向。

    手势识别技术主要分为接触式方案与非接触式方案,接触式方案采用数据手套,这个方法能够使用各种传感器获取手势的数据,能够达到较高的识别率,但设备穿戴复杂且成本较高,难于普及大众。而采用非接触式方案由于计算机视觉计算的发展进而采用计算机视觉技术进行识别手势,通过摄像头采集各类手势并传给计算机进行处理,用户不需要穿戴任何设备,所以具有方便,灵活,成本低等优点。而且动态手势比静态手势交互更加人性化,但同时难度也将极大提高,因此,本文将对动态手势识别技术展开研究,为了体现出工程应用理念,笔者将动态手势识别结果进行控制音频播放器。

总体方案设计

    基于计算机视觉的动态手势识别系统能够对于动态手势的移动进行识别,通过摄像头实时采集图片,将每一帧图片进行图像处理,并进行手部检测,一旦检测到目标,开始建立运动轨迹图,当手部移动时间达到八帧,则运动轨迹图建立完成并进行识别运动方向。为了解决手部往回动作出现“徘徊”问题,规定在识别到一个动作之后需要从中心移动,否则,不会进行手势识别操作。

1.1 总体研究内容

    1.图像采集环节,通过相机进行实时采集实景,完成图像采集环节;

    2.图像预处理环节,将采取到图片进行灰度化处理,并滤除图片在采集过程中携带的噪声,通过对比多种滤波效果,采用中值滤波方式对图像滤波,紧接着对图片进行增强处理,从而突出的手部的特征,方便后面进行检测;

    3.手部检测环节,在图像预处理环节完成后,通过调用手部分类器进行遍历图片的各个区域,从而获取图像中手部区域的位置信息;

    4.手势识别环节,通过手部检测环节检测出手部的位置将其添加到历史运动轨迹,更新运动轨迹图,根据运动轨迹图判断人手的运动方向进行判别识;

    5.控制音频播放器环节,通过手势识别结果控制音频播放器状态。

1.2 总体研究路线 

    (1)图像处理开源库OpenCV:OpenCV 是用 C++语言编写的,同时提供了 Python、Ruby、Matlab 等语言接口,可在 Windows、Linux 以及 Mac OS等多系统平台下运行,是一个跨平台支持多语言的通用库。目前 OpenCV 可以调用超过 500 个支持多平台的中、高层应用程序接口函数,从最底层的数学运算到高级的图像处理算法模块。目前 OpenCV 库的应用较为广泛,涉及到多个行业领域。

    (2)QT:Qt 是一个用于跨平台的图形界面程序开发的 C++工具包,提供给应用程序开发者建立图形用户界面所需的所有功能。并且是使用“一次编写,随处编译”的方式用于构建多平台图形用户界面程序。使用单一的源代码树和简单的重编译,能够在 Windows, MacOS X, Linux, Solaris, HP-UX 和其它使用 X11 的 Unix 版本下编制程序。Qt 完全面向对象且很容易扩展,它已经成为全世界范围内数千种成功的应用程序的基础。为世界上数千个最大的公司,包括 IBM、摩托罗拉和夏普等提供开发软件。

    (3)C/C++:C/C++语言相对于目前其他的较高级语言或脚本语言,如Java、C#、python,优势在于程序的运行性能。C/C++语言是直接运行在机器上,并不需要虚拟机作为中介,这直接提高了C/C++语言的运行效率,而且QT软件与OpenCV开源库都支持C/C++编程语言,为此适用于本项目的开发。

    拟解决的问题:通过相机实时采集图像;然后对图像进行预处理操作;在固定时间内,将每一帧检测到手部区域进行融合,完成运动轨迹图的建立;通过运动轨迹图进行几何特征分析从而识别出运动方向。其流程图1所示。

图1 方案研究路线

1.3 总体设计方案 

    根据以上的研究内容绘制了动态手势识别系统框图,如图2所示。


图2 动态手势识别系统的设计框图


版权声明:本文为V社区用户原创内容,转载时必须标注文章的来源(V社区),文章链接、文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件至:v-club@hikrobotics.com 进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容。
上一篇

OpenCV中利用knn进行数字(0-9)识别--RGB-D相机采集

下一篇

动态手势控制音频播放器(二)动态手势识别系统的设计

评论请先登录 登录
全部评论 1

很有创意的课题,思路也很清晰呢,学到了。

2023-09-07 10:14:30 浙江省
回复
  • 1
Lv.0
1
关注
5
粉丝
8
创作
14
获赞
所属专题
  • 使用3D相机MV-EB435i基于OpenCV的客流检测与异常识别的实现
  • 悉灵杯”课题研究进展(一)通过海康RGB-D相机获取带RGB信息的点云
  • “悉灵杯”课题研究-基于RGB_D相机的物品位置计算
  • “悉灵杯”课题研究-对RGB_D相机采集的三维点云处理
  • “悉灵杯”课题研究-RGB_D相机SDK集成及Open3d点云基本处理
  • “悉灵杯”课题研究-集成RGB_D相机SDK的Open3d点云可视化
  • “悉灵杯”课题研究-集成RGB_D相机SDK的Open3d点云功能UI项目开发(项目demo)
  • “悉灵杯”课题研究-RGB_D相机SDK三维点云存储
  • “悉灵杯”课题研究-OpenNI集成及示例代码开发
  • 悉灵杯”课题研究-MV-EB435i立体相机基于opencv图像处理使用yolov5的物体识别
  • “悉灵杯”课题研究-基于opecv的集成RGB_D相机SDK的基础小样物品颜色检测及人脸识别
  • OpenCV中利用knn进行数字(0-9)识别--RGB-D相机采集
  • “悉灵杯”课题研究-基于MV-EB435i的落差边缘检测算法开发记录
  • 悉灵杯”课题研究-LabVIEW集成及示例代码开发
  • “悉灵杯”课题研究-MV-EB435i立体相机集成Apriltags发布相机位姿
  • “悉灵杯”课题研究-MV-EB435i立体相机图像处理UI界面开发
  • “悉灵杯”课题研究-基于ROS1的RGB-D相机SDK集成及示例代码开发
  • 第二届“悉灵杯”课题移动机器人感知研究进展
  • “悉灵杯”课题研究—手眼标定方案
  • 第二届“悉灵杯”课题研究-基于RGB_D相机的室内环境建模
  • 悉灵杯”课题研究进展(二)-基于三维模型/场景点云的虚拟仿真数据生成
  • 悉灵杯”课题研究进展(一)-实例分割网络模型搭建与实验场景介绍
  • “悉灵杯”课题研究报告-基于RGB-D相机的2D和3D抓取定位方案研究
  • “悉灵杯”课题研究-基于点云配准算法GICP的3D抓取方案研究
  • “悉灵杯”课题研究-基于YOLO和GGCNN的物品平面抓取方案研究
  • 动态手势控制音频播放器-成果物
  • 第二届“悉灵杯”课题研究报告-动态手势控制音频播放器设计
  • 动态手势控制音频播放器(五)动态手势控制音频播放器exe
  • 动态手势控制音频播放器(四)动态手势识别系统的设计
  • 动态手势控制音频播放器(三)音频播放器设计
  • 动态手势控制音频播放器(二)动态手势识别系统的设计
  • 动态手势控制音频播放器(一)总体方案设计
  • 悉灵杯”课题研究进展(四)RGB-D相机引导机械臂分拣物料
  • 悉灵杯”课题研究进展(三)RGB-D相机引导机械臂分拣物料
  • 悉灵杯”课题研究进展(二)RGB-D相机引导机械臂分拣物料
  • ”悉灵杯”课题研究报告-基于RGB-D相机的机械臂物料分拣系统研究
  • 悉灵杯”课题研究报告-基于深度学习方法和虚拟仿真数据的机械臂引导方案
  • 第二届“悉灵杯”课题研究机械臂引导研究报告
  • 第二届“悉灵杯”课题研究机械臂引导研究进展(二)
  • 第二届“悉灵杯”课题研究机械臂引导研究进展(一)
相关阅读
  • VM4.4更新亮点
    2024-04-12 浏览 0
  • 第二届启智杯—光伏电池片质检视觉方案设计
    2024-04-15 浏览 0
  • 第二届启智杯-锂电外壳外观检测3D视觉方案设计
    2024-04-15 浏览 0
  • 第二届启智杯-无监督异常检测算法
    2024-04-16 浏览 0
  • 双车联动调试案例-华工中试基地
    2024-04-28 浏览 0

请升级浏览器版本

您正在使用的浏览器版本过低,请升级最新版本以获得更好的体验。

推荐使用以下浏览器