手势识别
手势识别是一种AI算法,从图像或视频中检测手部的21个关键点,并识别预定义的26种手势(手形和动作)。可实现非接触操作、手语识别、AR/VR交互、设备控制等新型人机交互(HCI)。
算法概述
由以下两个阶段组成。
- 手部姿态估计(Gestures Pose):检测手部的21个关键点(指尖、关节等)
- 手势分类(Gestures Classify):根据关键点配置识别26种手势
可识别手势(26种)
| 索引 | 手势 | 含义/用途 |
|---|---|---|
| 0 | call | 电话/呼叫 |
| 1 | dislike | 否定/NG |
| 2 | fist | 拳头/确定 |
| 3 | four | 数字4 |
| 4 | grabbing | 抓取 |
| 5 | grip | 握住 |
| 6 | like | 点赞/OK |
| 7 | little_finger | 小指 |
| 8 | middle_finger | 中指 |
| 9 | no_gesture | 中性 |
| 10 | ok | OK手势 |
| 11 | one | 数字1 |
| 12 | palm | 手掌 |
| 13 | peace | 胜利 |
| 14 | peace_inverted | 反胜利 |
| 15 | point | 指向 |
| 16 | rock | 摇滚手势 |
| 17 | stop | 停止 |
| 18 | stop_inverted | 反停止 |
| 19 | three | 数字3 |
| 20 | three_gun | 三枪手势 |
边缘AI基板(RV1126B)运行效率
| 处理阶段 | 模型大小 | 处理时间 |
|---|---|---|
| 手部姿态估计(Gestures Pose) | 11.6MB | 58ms |
| 手势分类(Gestures Classify) | 2.81MB | 5ms |
| 合计 | 14.41MB | 约63ms |
主要特点
- 21关键点+26种分类:高精度识别手部动作
- 高速处理:姿态估计58ms+分类5ms,合计约63ms
- 轻量模型:合计14.41MB的紧凑尺寸
- 实时支持:边缘AI基板上实现低延迟识别
应用场景
- 非接触操作界面(医疗现场、洁净室)
- AR/VR控制器的替代输入
- 手语识别系统
- 智能家居的手势控制(照明、家电)
- 数字标牌的交互操作
- 介护设施的非接触沟通
- 工厂的免提设备操作
边缘AI基板上的实现
利用 RV1126B 的 NPU,以手部姿态估计 58ms + 手势分类 5ms,合计约63ms完成处理。与USB摄像头或MIPI摄像头结合,可构建在边缘端闭环的手势识别系统。