某摄像头协议分析

旧年白白白 发表于 2023-7-12 16:13

# 某摄像头协议分析

## 环境

1. 主机：win10
2. 手机：Pixel 4 ，Android 10
3. APP版本：V4.70.0

## 工具

IDA、JADX、Frida、Charles、WireShark、x64dbg

## 逆向思路

总结：抓包 -> 分析数据包特征-> 确定UDP/TCP -> HOOK 发包函数 -> 分析代码 -> 验证

### 流量抓包分析

经过抓取APP与摄像头之间通信的流量，发现以下几种固定特征流量。

- magic:`3acf872a`

经过反复抓包，发现同一个包有以下特征：
> 3a cf 87 2a 00 01 00 00 01 00 00 00

这12个字节固定不变，后面的数据在变。

不同包，同样的magic，对比后发现原先12个字节的中间四字节会变化。

如下：

同一个包的client和server包，对比后发现原先12个字节的中间四字节也会变化，其他部分相似度很高。如下：

最终发现，整个数据长度为0x11c,中间四字节为0x00000100,那么我们可以得出真实数据为magic往后20字节，其他字节含义未知。
- magic:`20cf872a`

这个数据包比较简单，整体固定不变，可能保活心跳之类的数据包。
- magic:`10cf872a`

通过对比，也可以发现前16个字节后的四字节为数据长度，而这个包数据似乎里面还嵌套这另外的数据结构。

三种特征数据都是通过UDP传输，接下来的思路就是Hook libc.so 的sendto函数，打印调用堆栈。

### 查壳、脱壳

未查到，那就先将APK拖进JADX里进行分析。

### Frida Hook

撸起袖子就准备直接开干，Frida Server已启动，直接运行，HOOK libc.so的sendto函数，并打印堆栈。

### 加解密流程分析

经过回溯信息来看，相关函数都在libp2pc.so里面。这时候可以确定的是magic:`20cf872a`为ACK,使用IDA打开该so，打开p2p_send_msg_by_udp函数，发现里面并没有加密相关函数，最终追溯追到下面这个函数就戛然而止了！！！

进入p2p_udt_send_msg函数中，也没有发现相关加解密函数，全部都在取数据，然后发送。

分析发现，所有操作基于多线程。到这断了思路。

代码翻来翻去，注意到了这个p2p_log函数，既然静态分析不行，那就看看log日志，了解整个流程，HOOK p2p_log函数后打印已知字符串，就可以得到一大堆log。

经过观察，字符串最前的应该是函数名，那么去p2p_conn_get_timer_retry函数看看。

里面也没啥重要函数，在看看p2p_make_c2m_q函数。

到这里，基本上有点头绪了，点进p2p_make_cmd函数看看。

最终找到了主体函数p2p_enc_cmd，在这个函数里面，进行了参数组装。

gP2P_pCmdTable里面是字符串表，如下：

里面字符大概有C2D_S、C2M_Q之类的

gP2P_pParaTable也是字符串表，如下：

里面字符大概有uid、sid之类的

数据结构上是一个xml结构，大概是下面这种：

> <P2P>\n<C2M_Q>....</C2M_Q>\n</P2P>

通过交叉引用，发现了加解密的地方。

### magic:`3acf872a`数据

通过HOOK p2p_encrypt_and_decrypt和p2p_calc_crc函数后，发现这里就是magic:`3acf872a`数据组装和加密的地方，至此该数据包结构解清晰了。

 

|magic|data size|unknown|transmission id|checksum|payload|
|--|--|--|--|--|--|
|3a cf 87 2a|44 01 00 00|00 00 00 00|a4 0c 3d 00|95 49 09 56|d3.....|

- 4 Bytes magic: `3a cf 87 2a`
- 4 Bytes data size: 加解密数据长度
- 4 Bytes unknown: 固定字节，含义未知
- 4 Bytes Transmission ID: 加解密所需的key
- 4 Bytes Checksum: 加密后数据的CRC32校验值
- n Bytes Payload: 加解密数据

数据包结构清晰了，现在就要还原加解密算法了，在IDA里查看p2p_encrypt_and_decrypt伪码。

看起来就是简单的xor操作，但这里面有些函数比较陌生，比如

```c_cpp
v9.n128_u64 = 0x5A6C7F8D1F2D3C4BLL;
v9.n128_u64 = 0x8271635A38172E4BLL;
v10.n128_u64 = 0xA5C6F7D8863F1A2BLL;
v10.n128_u64 = 0x17F2D3A58371E1B4LL;v3 = vdupq_n_s32(a3);
v9.n128_u64 = 0x5A6C7F8D1F2D3C4BLL;
v9.n128_u64 = 0x8271635A38172E4BLL;
v10.n128_u64 = 0xA5C6F7D8863F1A2BLL;
v10.n128_u64 = 0x17F2D3A58371E1B4LL;
v4 = vaddq_s32(v9, v3);
```

于是去问了一下Google，这种是ARM NENO指令集，一种基于SIMD思想的ARM技术，NEON结合了64-bit和128-bit的SIMD指令集，提供128-bit宽的向量运算(vector operations)。有兴趣的看下这篇文章(https://zyddora.github.io/2016/02/28/neon_1/)，这里就不多赘述了。

那么接下来，就该祭出大杀器-ex咖喱棒了

以下是chatgpt的回答：

1. vdupq_n_s32(a3)：将 a3 的值复制到一个 128 位向量中的每个元素，生成一个包含相同值的向量 v3。
2. v9 和 v10 是两个 128 位向量变量，初始化为指定的常数值，通过 .n128_u64 和 .n128_u64 分别访问向量的第一个和第二个 64 位整数成员。
3. vaddq_s32(v9, v3)：将向量 v9 和向量 v3 中的对应元素相加，生成一个新的向量 v4。
4. a2 + 6 和 a2 + 3 是用于确定循环次数的值。根据这些值，计算出需要处理的向量元素个数 v7。
5. 进入循环，使用 NEON 指令进行加密和解密操作。*(_DWORD *)&a1 是对字符数组 a1 的访问，v9.n128_u32 是对向量 v9 的访问。^= 操作符表示按位异或运算，将结果存储回字符数组 a1 中。
6. 循环结束后，将字符数组 a1 的第 a2 个元素设置为 0。

通过HOOK p2p_encrypt_and_decrypt函数可知，a1为加解密原数据，a2为数据长度，a3为加解密所需的key。

我们逐句翻译IDA伪码，使用Python复现。

```c_cpp
v3 = vdupq_n_s32(a3);

```

将a3转换成4个short32的值并赋值给128 位向量变量V3。我们使用numpy库去实现。

```python
v3 = np.full(4, a3, dtype=np.int32)
```

```c_cpp
v9.n128_u64 = 0x5A6C7F8D1F2D3C4BLL;
v9.n128_u64 = 0x8271635A38172E4BLL;
v10.n128_u64 = 0xA5C6F7D8863F1A2BLL;
v10.n128_u64 = 0x17F2D3A58371E1B4LL;
```

.n128_u64代表128位的前64位，.n128_u64代表128位的后64位，而v9为4个int32的数组。根据高低位再把128位分为4个32位整数即可。小端计算。

```python
v9 =
```

v10同理。

```python
v10 =
```

vaddq_s32(v9, v3)，v9 和v3 中的对应元素相加，short32类型保存。Python中使用lambda表达式实现相加，并转化为list数组。

```python
v4 = list(map(lambda x, y: x + y, v3, v9))
```

v10同理。

```python
v10 = list(map(lambda x, y: x + y, v10, v3))
```

其他就是正常翻译就行了。完整代码如下：

```python
def p2p_decrypt(a1, a2, a3):
# 计算填充的字节数
padding_bytes = (4 - (a2 % 4)) % 4
# 添加填充字节
a1 += b'\x00' * padding_bytes
# 将a1字节数组转换为四字节整数的列表
enc_data = list(struct.unpack(f"<{len(a1) // 4}I", a1))
# 将a3字节数组转换为四字节整数的列表
v3 = np.full(4, a3, dtype=np.int32)
print("解密key四字节整数的列表: ", v3)
# 小端计算
# v9 =
v9 =
# v10 =
v10 =
# 将v3和v9整数列表里的整数一一对应相加
v4 = list(map(lambda x, y: x + y, v3, v9))
# print(v4)
v7 = len(a1) >> 2
print("解密数据循环次数: ", v7)
# 将v3和v10整数列表里的整数一一对应相加
v10 = list(map(lambda x, y: x + y, v10, v3))
# 将v4和v10整数列表里的整数一一对应相加
v9 = v4 + v10
if v7 > 0:
 for v6 in range(v7):
 # print(hex(a1), hex(v9))
 # 将加密数据整数列表里的整数与v9整数列表里的整数进行异或
 enc_data ^= v9
# a1 = 0
# 转换为小端存储的十六进制字符串
hex_string = ''.join()
hex_string_len = len(bytes.fromhex(hex_string))
if padding_bytes > 0:
 hex_string = bytes.fromhex(hex_string)[:hex_string_len - padding_bytes]
 print("解密数据异或后16进制数据: ", hex_string)
 return hex_string
else:
 hex_string = bytes.fromhex(hex_string)
 print("解密数据异或后16进制数据: ", hex_string)
 return hex_string
```

至此，magic:`3acf872a`数据的解密接完成了。

接下来我们看另外一个数据，magic:`10cf872a`。

上面提到该数据包含两种数据结构，经过观察研究发现，一种是加密数据，一种是明文音视频数据。

### magic:`f0debc0a`数据

加密数据

具体形式如下：

可以看出大体结构为10 CF 87 2A ......F0 DE BC 0A。经过和其他包对比发现DF 00 00 00 和CB 00 00 00为数据长度，其他字段未知。

Frida大法暂时失效了，无法应对多线程，打印堆栈只有一些不痛不痒的东西。

索性开辟新天地，盯上了它的PC版本。

打开软件，使用x64dbg附加，由于我们只关注同时包含10 CF 87 2A和F0 DE BC 0A的数据，因此可以在recvfrom函数上下条件断点，条件即buf = F0 DE BC 0A，设置如下：

最终堆栈情况如下：

使用IDA加载该dll，并跳转到0F69872D这个地址。为了方便x64dbg与IDA之间跳转，我们先将IDA的基址改为x64dbg里面的。反编译0F69872D，得到伪码如下：

经过分析发现，会进入sub_F697CC0这个函数，在跟进去看看。

反编译该函数代码后往下翻一翻就看到了比较关键的代码，如下：

 

根据sub_F772AF0函数打印的结果和原报文数据对比可知magic:`10cf872a`的数据结构大体如下：

 

|magic|connection id|unknown|packet id|packet size|payload|
|--|--|--|--|--|--|
|10 cf 87 2a|79 15 00 00|00 00 00 00|00 00 00 01|01dc 00 00|14.....|

- 4 Bytes magic: `10 cf 87 2a`
- 4 Bytes Connection ID: UDP 连接ID
- 4 Bytes unknown: 固定为`00000000`
- 4 Bytes Packet ID: 包序
- 4 Bytes Payload Size: 数据大小
- n Bytes Payload: 加密数据

到这本想投机取巧一下，大胆猜测是同一种加解密方法，于是就用magic:`3acf872a`数据的解密方法，拿Connection ID当作key尝试解密了一下，结果失败了。

到这只能继续分析找出该数据块的解密方法。

本想跟上一个数据一样通过字符串去定位，最终失败。只能通过调试去慢慢寻找，多线程操作，跳来跳去，真的掉头发哦。

x64dbg这块玩的并不是很熟，所以并不知道如何快速在调用堆栈中找到相关线程，有大佬知道的话，烦请指导一二，不甚感激！！！！

查了查Google也没找到技巧，那就只能铁杵磨成针，一个一个的拿着地址去IDA里面看。最后发现了一个线程里的函数代码非常的像。

反编译伪码如下：

我们在函数头和循环异或这里打个断点看一下。运行程序，断在函数头。

可以看到eax里的值即为去掉第一个数据结构（10 cf 87 2a）后的数据。再次F9断下刚刚循环异或的地方。

```assembly_x86
mov edx,
mov ecx, edx
sub ecx, esi
lea eax,
and eax, 7
```

计算byte_F942224的index。

```assembly_x86
lea esi,
mov al, byte_F942224
xor al, dl
xor , al
sub edi, 1
```

esi地址存储的为加密数据，每次取一个字节与byte_F942224数组里的一字节异或。

将其翻译为Python代码如下：

```python
def xml_decrypt(ba, offset):
key = bytearray()
e = bytearray(len(ba))
for i in range(len(ba)):
 xor_result = operator.xor(offset & 0xFF, operator.xor(ba, key[(i + offset) % 8]))
 e = xor_result
print(e.decode('utf-8'))
return e
```

magic：`f0debc0a`数据的加密方式就分析完了。通过上述代码分析，可得该数据结构大体为以下几种：

|magic|message id|message length|encryption offset|encrypt|message class|payload|
|--|--|--|--|--|--|--|
|f0 de bc 0a|01 00 00 00|2c 07 00 00|00 00 00 01|01dc|14 65|2d.....|

- 4 Bytes magic: `f0 de bc 0a`
- 4 Bytes Message ID: 消息ID
- 4 Bytes Message Length: 消息体长度
- 4 Bytes Encryption Offset: 加密key
- 2 Bytes Encryption flag: 加密标志
- 2 Bytes Message class: 消息类型
- n Bytes Payload: 加密数据

Or

|Magic|Message ID|Message Length|Encryption Offset|Status Code|Message Class|payload|
|--|--|--|--|--|--|--|
|f0 de bc 0a|01 00 00 00|28 01 00 00|00 00 00 01|c8 00|14 64|3b....|

 

- 4 Bytes magic: `f0 de bc 0a`
- 4 Bytes Message ID: 消息ID
- 4 Bytes Message Length: 消息体长度
- 4 Bytes Encryption Offset: 加密key

- 2 bytes Status Code:消息状态码
- 2 bytes Message class:消息类型
- n bytes Payload:加密数据

### 音视频数据

音视频magic如下：

- I Frame: 0x30, 0x30, 0x64, 0x63
- P Frame: 0x30, 0x31, 0x64, 0x63
- AAC:0x30, 0x35, 0x77, 0x62

视频数据内容如下：

还是经典的`10 cf 87 2a`结构，去除这个结构后就是视频数据结构了。结构大体如下：

- 4 Bytes I_frame_magic/P_frame_magic:视频I/P帧magic
- 4 Bytes video_type:视频类型-H264/H265
- 4 Bytes video_len:视频数据长度
- 4 Bytes channel:NVR 频道号
- 4 Bytes microseconds:NVR的时间戳精度
- 4 Bytes unknown:固定字节
- 4 Bytes utc_time:UTC时间
- 4 Bytes unknown:固定字节
- n Bytes video_data:视频数据

音频数据内容如下：

头部数据相同，这里不再赘述，直接看音频数据部分。

 

- 4 Bytes audio_magic:音频数据magic
- 2 Bytes audio_len:音频数据长度
- 2 Bytes audio_len:音频数据长度

到这里有关该摄像头的所有流量就分析完成了。

iamzwlz 发表于 2023-7-12 17:25

学习了，真不错

cn2jp 发表于 2023-7-12 16:28

注释的很详细，肯定费了不少精力，感谢！

smartdone 发表于 2023-7-12 16:34

内容太详细了，学到了{:1_932:}

moruye 发表于 2023-7-12 16:44

内容很详细，刚好可以学习学习，感谢楼主分享

xilige2020 发表于 2023-7-12 16:46

感谢分享！

xfsh666 发表于 2023-7-12 17:15

写的很好很详细，学习了

玄冥殇 发表于 2023-7-12 17:37

写的很好。奈何我没文化，看不懂这是干嘛滴{:1_909:}

friscky 发表于 2023-7-12 17:42

太牛了，可惜我看不懂:rggrg

晓森大人 发表于 2023-7-12 18:02

感谢大佬，学习了

页: [1] 2 3 4 5 6 7 8 9 10

吾爱破解 - 52pojie.cn's Archiver

某摄像头协议分析