跳转到内容

手势识别

手势识别是一种AI算法,从图像或视频中检测手部的21个关键点,并识别预定义的26种手势(手形和动作)。可实现非接触操作、手语识别、AR/VR交互、设备控制等新型人机交互(HCI)。

算法概述

由以下两个阶段组成。

  1. 手部姿态估计(Gestures Pose):检测手部的21个关键点(指尖、关节等)
  2. 手势分类(Gestures Classify):根据关键点配置识别26种手势

可识别手势(26种)

索引手势含义/用途
0call电话/呼叫
1dislike否定/NG
2fist拳头/确定
3four数字4
4grabbing抓取
5grip握住
6like点赞/OK
7little_finger小指
8middle_finger中指
9no_gesture中性
10okOK手势
11one数字1
12palm手掌
13peace胜利
14peace_inverted反胜利
15point指向
16rock摇滚手势
17stop停止
18stop_inverted反停止
19three数字3
20three_gun三枪手势

边缘AI基板(RV1126B)运行效率

处理阶段模型大小处理时间
手部姿态估计(Gestures Pose)11.6MB58ms
手势分类(Gestures Classify)2.81MB5ms
合计14.41MB约63ms

主要特点

  • 21关键点+26种分类:高精度识别手部动作
  • 高速处理:姿态估计58ms+分类5ms,合计约63ms
  • 轻量模型:合计14.41MB的紧凑尺寸
  • 实时支持:边缘AI基板上实现低延迟识别

应用场景

  • 非接触操作界面(医疗现场、洁净室)
  • AR/VR控制器的替代输入
  • 手语识别系统
  • 智能家居的手势控制(照明、家电)
  • 数字标牌的交互操作
  • 介护设施的非接触沟通
  • 工厂的免提设备操作

边缘AI基板上的实现

利用 RV1126B 的 NPU,以手部姿态估计 58ms + 手势分类 5ms,合计约63ms完成处理。与USB摄像头或MIPI摄像头结合,可构建在边缘端闭环的手势识别系统。

相关算法

相关资料