【python】树莓派相机实现手势识别，调百度API

xuehu96 发表于 2019-8-11 18:10

## 1. 做这个的想法
之前一直在玩百度的IOT天工物联网，一次偶然看到了人工智能标签下的人体分析功能，进去看了文档和API，发现有个手势识别很好玩，而且居然50000次/天免费

正巧，手边有一个带摄像头的树莓派3B，说干就干，开始。

## 2. 资料和准备

百度的API https://cloud.baidu.com/doc/BODY/s/ajwvxyyn0/

可以看到，能够识别24类手势，还挺好玩的，树莓派支持python，手势识别正好有python的API

首先远程连接树莓派，enable摄像头(raspi-config)

pip安装百度的aip库(sudo pip3 install baidu-aip)

python2今年就停止支持了，所以直接上python3

## 3.编写代码

代码主要分为3部分
- 拍照
- 人体识别
- 文字转语音

全部代码如下（AK和SK隐藏了，需要的时候换成你自己的就行，反正是免费的）：
```python
# 使用python3运行
# 作者：xuehu96
# 编写时间 2019年8月11日
from picamera import PiCamera,Color
import time
import demjson
from pygame import mixer
from aip import AipBodyAnalysis
from aip import AipSpeech

hand={'One':'数字1','Five':'数字5','Fist':'拳头','Ok':'OK',
   'Prayer':'祈祷','Congratulation':'作揖','Honour':'作别',
   'Heart_single':'比心心','Thumb_up':'点赞','Thumb_down':'Diss',
   'ILY':'我爱你','Palm_up':'掌心向上','Heart_1':'双手比心1',
   'Heart_2':'双手比心2','Heart_3':'双手比心3','Two':'数字2',
   'Three':'数字3','Four':'数字4','Six':'数字6','Seven':'数字7',
   'Eight':'数字8','Nine':'数字9','Rock':'Rock','Insult':'竖中指','Face':'脸'}

# 下面的key要换成自己的
""" 人体分析 APPID AK SK """
APP_ID = '*******'
API_KEY = '*******************'
SECRET_KEY = '*******************'
""" 语音技术 APPID AK SK """
SpeechAPP_ID = '*******'
SpeechAPI_KEY ='*******************'
SpeechSECRET_KEY = '*******************'

camera = PiCamera()
client = AipBodyAnalysis(APP_ID, API_KEY, SECRET_KEY)
Speechclient = AipSpeech(SpeechAPP_ID, SpeechAPI_KEY, SpeechSECRET_KEY)

'''cam config'''
camera.resolution = (1280, 720)
camera.annotate_text = "xuehu96 !" #图片上加水印
#camera.annotate_background = Color('blue')
camera.annotate_text_size = 20
camera.annotate_foreground = Color('white')
camera.brightness = 55

""" 读取图片 """
def get_file_content(filePath):
with open(filePath, 'rb') as fp:
   return fp.read()
mixer.init()
while True:
"""1.拍照 """
camera.start_preview()
time.sleep(2)
mixer.music.stop()
camera.capture('./image.jpg')
camera.stop_preview()

image = get_file_content('./image.jpg')

""" 2.调用手势识别 """
raw = str(client.gesture(image))
text = demjson.decode(raw)
try:
   res = text['result']['classname']
except:
   print('识别结果：什么也没识别到哦~' )
else:
   print('识别结果：' + hand)

   """ 3.调用文字转语音"""
   content = hand
   result = Speechclient.synthesis(content, 'zh', 1, {'spd': 2, 'vol': 6, 'per': 1})
   #print(result)
   if not isinstance(result, dict):
         with open('./res.mp3', 'wb') as f:
            f.write(result)

         mixer.music.load('./res.mp3')
         mixer.music.play()
#          time.sleep(3)
#
```

## 4. 运行与测试
编写一个body.py, 然后 python3 body.py就可以运行了，如果缺少什么库就sudo pip3 install xxx就行了

图片和测试结果贴在文章的最后。

可以看到，百度在ai方面还是挺强的，识别率很高。识别出后，通过文字转语音，再用pygame模块播报出来，再给树莓派接上USB小音箱，就能听到识别的结果了

## 5. 最后
可以看到 python语言确实非常简单方便，短短几十行代码，就完成了这样一个小功能，这样的小作品用做本科的普通毕业设计都绰绰有余，而且可以在此基础上加更多的功能，比如和智能家居联动（手势打开窗帘，手势开灯等等），就更好玩了。不过我只是想起来就做了这个小想法，没准备做更多的功能，上面你的代码完整并且完全开源，填上key就能运行，大家有兴趣了可以在我代码基础上添加更多创意。

萧筱小 发表于 2019-8-11 20:09

爱拍阴天发表于 2019-8-11 19:18
牛逼，就是百度api的实在是太少了要是有那种自定义的就完美的（纯属瞎扯）

可以啊，自定义就是自己开发一个。可以的

xuehu96 发表于 2019-8-11 19:43

582938472 发表于 2019-8-11 19:07
一直都在识别吗还是有延时的

目前是3秒识别一次，因为百度的API是上传图片，不是视频流无法做到实时识别

xuehu96 发表于 2019-8-11 18:13

补一张图片

wuai6757620 发表于 2019-8-11 18:18

看不懂！

不败的意志 发表于 2019-8-11 18:26

大神的水平高啊！刚开始学习python，膜拜中。

zyy22664488 发表于 2019-8-11 18:27

感谢分享

慕沐发表于 2019-8-11 18:33

果然还是大神一个想法就实施
下次我有想法能不能让你帮忙哈哈

582938472 发表于 2019-8-11 19:07

一直都在识别吗还是有延时的

爱拍阴天 发表于 2019-8-11 19:18

牛逼，就是百度api的实在是太少了要是有那种自定义的就完美的（纯属瞎扯）

页: [1] 2

吾爱破解 - 52pojie.cn's Archiver

【python】树莓派相机实现手势识别，调百度API