

大家好,本期主题是开源框架的分享,所以今天会给大家分享下最近我接触的一款工具。
本文首发于《安全客 - 有思想的安全新媒体》,也是以本人身份lateautumn4lin原创发布的,原文链接:https://www.anquanke.com/post/id/218915
这次介绍的是一款基于FastAPI实现的Frida-RPC工具-Arida(Github地址:https://github.com/lateautumn4lin/arida),我是这个工具的独立开发者,想跟大家介绍下这款工具的开发构想以及它的使用方式。

1 开发设想
工具往往来源于日常工作,当工作中出现了“重复、重复、又重复”的环节时,一款能够节约时间、提高工作效率的工具便顺应诞生了。我的日常工作会涉及逆向分析APP协议
,目前使用的工具一般都是Frida
,有时候为了验证分析结果,都会采用Hook
的方式调用方法并通过自带RPC
的方法暴露出接口来,因为日常分析的APP数量比较多,所以碰到了一系列的问题促使我想给自己开发一套工具提升工作效率。

1.1 工作中遇到的问题
1.1.1 多APP多个Frida-Js文件
刚刚开始在工作中频繁使用Frida
工具的同学一定会发现每次逆向分析APP的时候都需要写不同的JavaScript
文件,时间一长,如何维护这么多文件?如何针对不同的APP启动对应的JavaScript
文件?每个文件的重复代码如何抽取出来? 这些都是关于Frida-Js
文件管理的问题。
1.1.2 写好的Js方法要构造对应的API方法
这个问题怎么理解呢?大家知道Frida JavaScript Function
的暴露方法是这样的
rpc.exports = {
decryptData: decrypt_data,
generateUrl: generate_url,
encryptData: encrypt_data
}
使用rpc.exports
对应的Map
来指定暴露方法和对应的函数,但是这样的话也只是利用了JavaScript
的exports
关键字使方法暴露出来使其他脚本能够调用。那怎么能够做成Http接口呢?可以直接利用NodeJs
的Http框架
,例如Express
,不过我们使用最多的一般都是Python
,例如Flask
、Django
这样的框架,用过框架的人都知道我们需要针对每个API写对一个的方法,例如这样
@app.route("/test")
def test():
return "hello"
结合这种方式,我们调用Frida-RPC
的方式就是这样
@app.route('/sign')
def sign_test():
sign = request.args['sign']
res = script.exports.sign(sign)
return res
我们需要针对每个JavaScript
方法写对应的Python
方法并且要直接调用的参数,这导致的问题就是累积的方法越多,我们的整体项目就越庞大,但是其中很多部分的代码都是重复的简单的调用代码。
1.1.3 协作问题
同样是个很麻烦的问题,当你很费劲的完成以上的所有操作并且部署好服务之后,其他人要使用你的这些API,你是否能提供一个完整的API文档
?难道还是需要一个个接口去写相应的文档?

1.2 工具需要解决哪些痛点
针对以上的这些问题,我们需要一款高效率的工具能够帮助我们屏蔽这些工作中的细节问题,让我们能够更专注于去逆向分析APP中的调用流程。所以,我们需要一款工具能够完成以下这些功能:

1.3 Arida工具
当“想开发一个工具”的想法产生的时候,就风风火火的搞起来了,大概花了两个小时的时间,完成了一个简单的工具,也就是这次提到的Arida
这个工具,名称来源于Frida
和API
这两个词,简单拼接成的,具备的功能也是如上文提到的一样。
1.3.1 具体工作流程
工作流程如下:

主要分为四步:
-
第一步:利用JavaScript AST树
获取到exports
的Map
中的函数名称以及对应的函数的参数个数,以便于后续的构造Pydantic
的Model
。
-
第二步:生成Pydantic
动态模型便于FastAPI
的API Doc
的生成。
-
第三步:结合模型
以及获取到的JavaScript的方法名和参数个数
产生新的Python方法
。
-
第四步:注册各个APP相对应的路由,最后注册到全局路由中。

2 源码解读
之前大致讲了Arida
的整个工作流程,下面主要讲解下各个部分的实现。

2.1 Frida JavaScript脚本函数信息导出
一般的Frida-Js
脚本的是这样的
var result = null;
function get_sign(body) {
Java.perform(function () {
try {
var ksecurity = Java.use('com.drcuiyutao.lib.api.APIUtils');
result = ksecurity.updateBodyString(body)
console.log("myfunc result: " + result);
} catch (e) {
console.log(e)
}
});
return result;
}
rpc.exports = {
getSign: get_sign,
}
我们需要获得的信息是导出函数名
以及导出函数对应的内部函数的参数个数
,考虑过使用正则来做,不过正则方法显得笨重,所以从JavaScript AST
树入手,能够更好的解析到我们需要的信息。
解析的脚本如下:
const babel = require('@babel/core')
var exports = new Map();
var functions = new Map();
var result = new Map();
function parse(code) {
let visitor = {
ExpressionStatement(path) {
let params = path.node.expression.right;
try {
params = params.properties
for (let i = 0; i < params.length; i++) {
exports.set(params[i].value.name, params[i].key.name)
}
} catch {
}
},
FunctionDeclaration(path) {
let params = path.node;
var lst = new Array();
for (let i = 0; i < params.params.length; i++) {
lst.push(params.params[i].name)
}
functions.set(params.id.name, lst)
}
}
babel.transform(code, {
plugins: [
{
visitor
}
]
})
exports.forEach(function (value, key, map) {
result.set(value, functions.get(key))
})
return Object.fromEntries(result);
}
主要解析了function
和exports
两个节点,最终返回Map

2.2 FastAPI API接口模型动态生成
上一步得到了JavaScript
的Map
数据,大概是这样
{
"getSign":3
}
接下来,需要利用这个信息来动态生成接口模型,之所以要生成接口模型,是因为在FastAPI
这个框架当中,Post
接口使用的是Pydantic
的BaseModel
,使用BaseModel
的原因也是因为一方面要生成对外的接口文档,另一方面要对参数做类型校验,动态生成的代码如下:
from pydantic import create_model
params_dict = {"a":""}
Model = create_model(model_name, **params_dict)
引入Pydantic
的create_model
,参数是各个方法参数的类型,例如是String
类型就直接是""
,是int
类型就直接是0
。

2.3 基于Python AST动态生成Python方法
到了最后一步,有了模型以及JavaScript
的Map
数据我们就可以动态生成Python
方法了,由于一般的API方法都是一样的,如下:
def sign_test():
sign = request.args['sign']
res = script.exports.sign(sign)
return res
我们这需要动态生成以上这种格式就好了,可以采取两种方案
-
第一种:闭包的方法-函数返回函数,比如
def outer():
def inner():
return "hello"
return inner
-
第二种:使用Python AST
树生成Python字节码
,利用types.FunctionDef
来生成,代码如下:
function_ast = FunctionDef(
lineno=2,
col_offset=0,
name=func_name,
args=arguments(
args=[
arg(
lineno=2,
col_offset=17,
arg='item',
annotation=Name(lineno=2, col_offset=23,
id=model_name, ctx=Load()),
),
],
vararg=None,
kwonlyargs=[],
kw_defaults=[],
kwarg=None,
defaults=[],
posonlyargs=[]
),
body=[
Assign(
lineno=3,
col_offset=4,
targets=[Name(lineno=3, col_offset=4,
id='res', ctx=Store())],
value=Call(
lineno=3,
col_offset=10,
func=Attribute(
lineno=3,
col_offset=10,
value=Attribute(
lineno=3,
col_offset=10,
value=Name(lineno=3, col_offset=10,
id='script', ctx=Load()),
attr='exports',
ctx=Load(),
),
attr=func_name,
ctx=Load(),
),
args=[
Starred(
lineno=4,
col_offset=38,
value=Call(
lineno=4,
col_offset=39,
func=Attribute(
lineno=4,
col_offset=39,
value=Call(
lineno=4,
col_offset=39,
func=Name(
lineno=4, col_offset=39, id='dict', ctx=Load()),
args=[
Name(lineno=4, col_offset=44, id='item', ctx=Load())],
keywords=[],
),
attr='values',
ctx=Load(),
),
args=[],
keywords=[],
),
ctx=Load(),
),
],
keywords=[],
),
),
Return(
lineno=4,
col_offset=4,
value=Name(lineno=4, col_offset=11, id='res', ctx=Load()),
),
],
decorator_list=[],
returns=None,
)
先动态生成对应方法的Python AST树
module_ast = Module(body=[function_ast], type_ignores=[])
module_code = compile(module_ast, "<>", "exec")
function_code = [
c for c in module_code.co_consts if isinstance(c, types.CodeType)][0]
生成对应Python AST树
的字节码
function = types.FunctionType(
function_code,
{
"script": script,
model_name: model,
"print": print,
"dict": dict
}
)
function.__annotations__ = {"item": model}
利用字节码
生成新的方法,由于在生成新方法的时候会丢失原字节码的注解,也就是__annotations__
这个属性,因此需要在生成新方法之后手动补充。

3 使用方式
下面讲下Arida
具体的使用方式,项目中已经包含了两个简单的例子,在Apps
目录下面,配置信息在config.py
文件中。

3.1 两步构建新项目
如何构建新项目呢?只需要两步就可以了,按照如下所示的步骤:
- 第一步:添加配置信息,文件地址是
config.py
INJECTION_APPS = [
{
"name": "我的测试1",
"path": "yuxueyuan",
"package_name": "com.drcuiyutao.babyhealth"
},
{
"name": "我的测试2",
"path": "kuaiduizuoye",
"package_name": "com.kuaiduizuoye.scan"
}
]
如代码中所示,需要在INJECTION_APPS
列表中添加具体APP的信息,主要是三个字段:
- 第二步:开发对应APP的
Frida-Js
脚本

3.2 企业级多APP签名API暴露
因为在日常工作中,我们往往会同时去逆向分析多个APP,所以同时暴露多个APP的API接口测试也是必不可少的,Arida
支持同时启动多个APP并注入相应的JavaScript
脚本,只需按上面的步骤完成每个APP项目的开发,启动的时候会自动注入相应的APP,同时,在查看文档的时候也会如图所示:


4 注意点

4.1 参数类型标记
由于JavaScript
不能指定方法的参数的类型,导致读取到的JavaScript
的方法只能是参数个数,不能获取参数的类型,因此生成的Pydantic模型
的时候只能统一类型为字符类型,如果想要自定义参数的类型,可以在main.py
文件中的function_params_hints
来进行配置:
function_params_hints = {
"encryptData": [0, 0, 0, 0, "", 0, 0, 0, 0, 0, 0]
}
通过这样来生成合适的参数模型,这样在使用者使用接口的时候由参数模型根据模型中的参数对应的类型来进行类型转化。
