ANKI_VECTOR 机器人远程控制

dukeimp 发表于 2021-7-8 17:37

ANKI_VECTOR SDK源码解析(教程)
一：最近anki vector robot开放了Python SDK，我听到的第一时间就赶快上网查了查，先抛几个官网重要链接吧：
Python编程API手册及环境搭建等：
　　https://sdk-resources.anki.com/vector/docs/generated/anki_vector.html
anki公司github地址及anki_vectorSDK实现源码，用于理解电脑和vector的通信协议，包含教学例程：
　　https://github.com/anki/vector-python-sdk
一些关于cozmo和vector编程使用的Web工具，可以在浏览器看到机器人看到的图像：
　　https://github.com/GrinningHermit/Vector-Explorer-Tool
anki编程交流社区：
　　https://forums.anki.com/
cozmo在线手册：
　　http://cozmosdk.anki.com/docs/initial.html
cozmo编程SDK源码及教学例程源码：
　　https://github.com/anki/cozmo-python-sdk
new:DDL官方SDK教学视频：(40分钟)(2020年新出的)
　　https://courses.digitaldreamlabs.com/enrollments
目前没有相关书籍，anki不是像google一样的一流大厂。笔者从事C++开发，对python编程也是小白级别，对vector编程的学习也全是靠上面这几个链接。

　　首先，你得拥有一台vector和一台能用于编程的电脑（对操作系统没有要求，这点很不错），使它们处于同一个局域网内（都连着家里的wifi就行）。具体安装python和搭建环境等细节不再展开，在线文档写的已经很详尽了。
转载请注明出处：https://www.cnblogs.com/xjjsk/p/10159946.html
二：接下来的部分介绍几个简单的官网demo：
　　源码目录：vector-python-sdk-master/examples/tutorials/

首先，第3行引入anki_vector模块，其实就是一个叫做anki_vector的文件夹，目前所有的程序，只需要引入这个模块就拥有vector的所有控制功能了。

第6行解析命令行参数，只需要写在这就行了，暂时用不着命令行参数。
第7行将解析后的命令行参数传给Robot类，创建一个Robot对象，取名为robot。
从第8行开始操作robot，就能完成所有对vector机器人的操作了。
例如，第9行让你的机器人说一句“Hello World”，目前不支持中文，但是可以用汉语拼音哈哈哈。
11行和12行，如果这个文件是被别的文件引用，则main只是个普通被调函数，否则就执行main()函数。
其实，每一个程序都是这么写的，你只需要复制上面的代码，将第8、9两行换成你需要实现的逻辑就行，而所有的控制，都可以通过robot对象实现。
当然，引入anki_vector模块就是为了得到robot对象的，除了这个模块，你还可以引入任何其他python库进来玩，甚至可以使用ros、opencv等庞大的库进行人工智能编程。
如果不清楚robot里面支持哪些操作，可以翻阅其他的例程和vector的在线API文档。如果有遇到非常奇怪的Bug，可以到vector社区提出，与其他开发者交流。

　　其实我感觉anki_vector的接口封装的特别好，就只需要看上面一个例子，再结合API文档，就能玩遍所有功能了。

anki_vector.Robot(args.serial)，这一句是创建一个robot对象，并连接到你的小V，每个程序开头一般都少不了这一行。而Robot这个对象的创建也是具有很多参数的，在这个例子中它只带了一个参数，其他的参数都使用默认参数。下面列出了这个重要的构造函数的所有参数及默认值：

class Robot:
　　def __init__(self,
　　　　serial: str = None,#矢量序号。机器人的序号(ex. 00e20100)位于向量的底面，或从Vector的调试屏幕访问。用于确定要加载哪个向量配置。
　　　　ip: str = None,#Vector的ip地址。(可选)
　　　　config: dict = None,#自定义的dict，覆盖Vector配置中的值。(可选)
　　　　default_logging: bool = True,#记录日志
　　　　behavior_activation_timeout: int = 10,#连接超时时间。
　　　　cache_animation_list: bool = True,#获取启动时可用的动画列表。
　　　　enable_face_detection: bool = False,#相册开关。
　　　　enable_camera_feed: bool = False,#相机开关
　　　　enable_audio_feed: bool = False,#音频开关
　　　　enable_custom_object_detection: bool = False,#自定义对象检测开关
　　　　enable_nav_map_feed: bool = None,#导航地图开关
　　　　show_viewer: bool = False,#相机画面开关
　　　　show_3d_viewer: bool = False,#3D画面开关
　　　　requires_behavior_control: bool = True):#是否控制小V的行为系统
　　　　pass

可以有选择的填入，普通情况下只需要小V的编号serial就行了。

三：所以接下来，我将尝试对SDK进行源码解析，看看其他语言是否也能实现控制功能。
　　以下是刚刚下载下来的源码目录：

anki_vector目录下存放的就是SDK库源码了，这是最重要的，接下来我就阅读这一部分。

examples目录下存放着一些应用例子，就是调用了anki_vector模块的示例程序，包含了上面讲的01_hello_world.py例程，如果还不清楚怎么调用anki_vector，可以多看看这部分。

剩下的都是一些无关紧要的文件，感兴趣可以翻阅一下。

接下来打开anki_vector目录：

虽然文件很多，但是并不复杂，没有太多的嵌套，就一个平滑的文件列表，里面每一个py文件都实现了vector的一个控制功能（例如：背灯的控制由lights.py实现，照相的控制由camera.py实现），少数py文件用于实现基础功能和最后汇总（例如robot.py用于汇总对vector的控制功能，在调用这个库时只需要创建一个Robot类的对象，其他的操作全由这个对象间接完成）。

最重要的是，这些文件与官网API几乎是一一对应，也就是说，每个文件内都封装了一个功能类。

下面是在线文档中的API，可以与上面的库目录对比着看，对每个API的说明也是对每个文件的说明：

具体每个类实现了哪些方法，可以点击对应的在线文档API进去看，也可以直接看源码。

浏览了anki_vector库的概貌之后，我们再回到最先讲的hello world程序，看看在那几个调用中，到底发生了什么。

四：hello world内部实现

这个程序里，其实程序里面最不理解的就是这两句：

args = anki_vector.util.parse_command_args()
with anki_vector.Robot(args.serial) as robot:
robot.say_text("Hello World")
pass

按照调用次序顺藤摸瓜，从anki_vector模块中找到util模块，再从util模块找到parse_command_args函数的实现，调用的时候是不带参数的：

parser是函数参数，在前面的例程中，我们没有传递参数，默认是None。argparse是python的一个常用库，最后发生的就是在87行设置一些默认参数，，88行返回。
再回到hello_world例程中，把返回的args直接传递给Robot的构造函数。
在with ... as ...语句中，创建了一个Robot类型的对象robot，然后隐式调用了Robot类的__enter__函数，在with ... as ...语句结束后会隐式调用__exit__函数。而里面所做的，就是调用connect成员函数和disconnect成员函数，可以简单的认为是与你的vector机器人建立连接和断开连接，connect函数内部代码有点长，但是逻辑很简单，就是初始化所有的功能类对象，这里不再展开：

然后先看一下say_text函数：创建一个protobuf定义的协议结构体对象，然后填充内容，然后使用gRPC发送给小V。gRPC是基于protobuf和http2.0的一种通用的RPC，使用它可以方便的生成服务端和客户端代码，由此也可以看出小V内部使用的是gRPC服务端。

看完这些后，大体明白了robot.py的作用，这个模块不做具体的工作，只是简单的把其他基础模块的功能集成进来，为外部用户提供一个统一的接口。从这个文件的开头也能看出，它引用了同级目录下的几乎所有模块。

五：功能模块详解

回头仔细看看anki_vector目录，里面除了python源文件，还包含了三个目录，一个是messaging，一个是opengl，一个是configure。
打开messaging，一看里面的文件后缀就知道，这是在使用gRPC，google开源的通信框架，基于google protobuf实现，是一种高效率的、使用非常便捷的、被广泛使用的通信方法，应该是用于电脑和vector的所有通信。虽然文件多，但是其实编码时只需要编写proto后缀的文件，用这些文件说明协议和RPC规则，编写完proto文件后，运行google提供的工具，就能生成两个同名的py文件。例如编写了*.proto，运行工具就会生成*_pb2.py和*_pb2_grpc.py两个文件，然后在源码中使用这两个生成的文件就行。而且用的是protobuf的第2版本，已经有第3版本了。
opengl目录更不用说了，调用了openGL，应该是用于处理和渲染vector看到的图像，或者输入一些图像给vector。
configure目录内只有一个__main__.py，用于配置自己的vector的信息，使电脑有权限能够连接特定vector。
了解完这些，对SDK源码已经有全局的了解。之后将调出几个具体的功能讲一下，所有功能的实现流程都大致相同

orb001 发表于 2021-7-8 19:58

大牛，厉害。

shark1 发表于 2021-7-8 21:51

感觉这个操作性还挺强的

lintian426 发表于 2021-7-9 00:51

感谢楼主分享，感觉又手残了。。。。。。

雾都孤尔 发表于 2021-7-9 01:09

试试看总是可以得，感谢分享。

a3322a 发表于 2021-7-9 06:58

还是PY的人工智能强大！

隔壁在咚 发表于 2021-7-9 08:47

想学习，没时间

页: [1]

吾爱破解 - 52pojie.cn's Archiver

ANKI_VECTOR 机器人远程控制