吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 9333|回复: 72
收起左侧

[Web逆向] 利用 ast 解混淆某东 h5st js 文件并进行参数分析

  [复制链接]
kylin1020 发表于 2024-4-14 21:35

声明

本文章中所有内容仅供学习交流使用,不用于其他任何目的,不提供完整代码,抓包内容、敏感网址、数据接口等均已做脱敏处理,严禁用于商业用途和非法用途,否则由此产生的一切后果均与作者无关.本文章未经许可禁止转载,禁止任何修改后二次传播,擅自使用本文讲解的技术而导致的任何意外,作者均不负责,若有侵权,请联系作者立即删除.

目标地址: aHR0cHM6Ly9zZWFyY2guamQuY29tL1NlYXJjaD9rZXl3b3JkPWlwaG9uZSZzdWdnZXN0PTEuaGlzLjAuMCZ3cT1pcGhvbmU=

前期参数分析

打开目标地址, 查看网络请求可以知道携带有h5st参数.
1712495923754-538e7ee9-46c9-465a-81f3-a5b7414096ba.png
从调用栈中出现的 js 文件列表中搜索h5st关键词, 可找到两处相关代码, 且两处调用的函数一样, 都是window.PSign.sign.
1712495980092-3c5a0221-3c57-4245-952e-38c79da940a4.png
1712496160558-4683f092-b9c5-4505-a753-0b9be0517ba1.png
分别在两处代码打上断点调试, 然后重新刷新, 代码停在其中一处并且知道了传递进来的参数.
1712496354250-3c0044d9-4390-4b85-8402-fe24f0290435.png
尝试单步调试, js 文件跳转到 js_security_v3_0.1.6.js 的一处函数中.
1712496485655-7f88fbcc-a16a-451c-a677-fb00f87e0c80.png

解混淆

js_security_v3_0.1.6.js文件进行的一定程度的混淆, 直接进行参数分析可能较困难, 所以尝试先利用 ast 解开部分混淆规则, 例如先解决字符串替换函数, 控制流等, 然后再进行分析会更容易理解代码逻辑.

1.1 字符串函数还原

字符串函数意思是指传入指定参数返回特定解码字符串的函数, 该函数目的是将字符串隐藏起来, 防止逆向时通过关键词搜索到关键代码逻辑. 如window.PSign.sign函数入口处的代码所示, 其中rt(o, e - 809))即是字符串函数, 实际返回apply关键词.
1712497713912-10dfe528-a7a2-4aed-ba5b-00351d746597.png
因此对于以下代码:

return nt[(e = t,
o = r,
rt(o, e - 809))](this, arguments)

实际上应该简化为:

return nt["apply"](this, arguments)

js_security_v3_0.1.6.js用到了大量的字符串函数, 并且调用的字符串函数还不相同, 有的甚至是嵌套传递一个新的偏移值后作为一个新的字符串函数.
1712499590068-42474e60-6253-4d02-ab53-40ca1a354405.png
因此首先要分析下这些字符串函数的共同特性或者最终会调用到哪个根字符串函数, 从根字符串函数(假设函数名为rootFunc)开始查找引用到的地方, 如果是直接传递数值则直接解码得到字符串并利用 ast 将函数调用节点替换成字符串的节点, 如果传递进来的是参数而不是具体的数值(例如: rootFunc(a-1, b-2), 其中 a, b 是参数, 不是数值), 则找到该调用所处的函数继续查找调用引用该衍生函数的地方继续进行判断, 如果是数值则可以加上偏移解码得到字符串, 否则继续重复上述操作, 直到所有引用的地方都是具体的数值传入为止.
1712503022023-e787f8a6-6926-4083-ac4c-ed9d63c82e71.png

1.1.1 字符串函数分析

rt字符串函数为例, 查看rt字符串函数的代码, 可知rt函数是返回$v函数加上偏移的结果; 继续跟踪$v函数, 得到$v函数来自kA函数加上特定偏移; 然后继续查看kA函数, 可以知道kA函数进行了具体的解码字符串操作, 是根字符串函数.
1712504274976-ea99b665-5b62-4ee1-abb9-446d39a41dc8.png
1712504369523-e1c347ef-5cde-4133-b2af-57ca9b6b6ffa.png
1712504468617-a314d9f5-b1f9-4cb7-8f6a-8fa6b9e01052.png
通过对kA函数进行简单的理解分析, 可以发现决定其字符串返回值的只有第一个参数r, 参数e是无用的, 第一个参数与字符串的关系是一一对应的.
首先需要知道kA能获取到哪些字符串, 通过对kA函数进行分析可以知道, kA函数先调用EA函数获取一个字符串数组, 取该字符串数组下标为r-500的字符串, 然后对该字符串解码得到真实字符串, 解码操作类似 base64, 不过还原成字符的时候每个n是取自字符串"abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789+/="的下标而不是每个字符的 charCode.
1712673093952-28bb2926-3300-4591-a3fb-c2acb2891357.png
所以我们知道kA函数的取值范围是[500, 500+EA().length], 可以在window.PSign.sign函数入口处断点中计算好所有字符串和入参的关系.
1712758797647-b6c86a46-25b4-4d32-8a08-8ea89a0452a9.png

1.1.2 利用 ast 还原字符串函数

首先安装@babel/parser, @babel/types, @babel/generator, @babel/traverse, fs

npm install @babel/parser @babel/types @babel/generator @babel/traverse fs

然后解析将 js 代码解析成 ast 对象并定位到kA函数的定义处, 可以先将 js 代码扔到astexplorer.net上辅助分析(关于 babel 如果操作 ast 结构, 可以参考此文章: https://juejin.cn/post/7045496002614132766).

const fs = require('fs');
const parser = require("@babel/parser");
const types = require("@babel/types");
const generator = require("@babel/generator").default;
const traverse = require("@babel/traverse").default;

const input = "js_security_v3_0.1.6.js";
const content = fs.readFileSync(input, {encoding: "utf-8"});
const ast = parser.parse(content);

function handleStringFunction(path) {
    const { node } = path;

  // 找到kA函数
  if (node.id.name !== "kA" || node.params.length !== 2) {
        return;
    }

}

traverse(ast, {
    FunctionDeclaration: {
        enter: [
            handleStringFunction
        ]
    }
});

然后把kA函数得到的字符串数组复制过来, 定义为kAWords数组.
1712759175664-f5540819-73df-42f8-89ef-f765df7047f5.png

接着使用 path.scope 查找所有调用 kA 的地方并将其放到一个 to_visit 的队列中, 便于遍历所有情况, 如果调用 kA 传递的参数不是具体数值还需要将当前调用者所处的函数的所有调用记录加到 to_visit 中, 如果是数值则可以直接得到结果并替换调用节点为字符串节点.
1713020679649-cf3b7b9a-8bdb-41c7-8d1a-c21c280373b9.png

传入 kA 的参数需要分几种情况分析
(1) 全是数字, 例如:

kA(100, 200)

在 astexplorer.net 中分析, 此时可以清楚地知道它的 arguments 中的第一个参数是NumericLiteral类型(对于 kA 函数来说, 它的返回值只跟第一个参数有关, 所以只用看第一个参数就行).
1713018430330-7a0ad4ba-b6ca-41b5-ba52-d288cb0a59e6.png
因此可以写如下函数来获取值:
1713019764125-e1bd6552-ed46-4424-8f7f-6dbe1fffc9c1.png

(2) 传入参数是变量加偏移. 分析kA函数的调用列表可知道, 有很多这种情况.
1713019148635-b15fcde0-10ed-4f55-8cc0-9fd4e1dc44fb.png
抓住其中一个调用分析它的 ast 结构, 着重看第一个参数的 ast 结构.
1713019416594-6473c4c8-4295-4a36-86e6-ecccd6b81414.png
1713020135765-61e4d14f-e15f-4e6b-bba3-036f361af46e.png
1713020260091-0e809455-d2bf-400b-8113-f3112b03117f.png

可以看出来, 第一个参数是一个BinaryExpression表达式, 这个表达式的 left 是一个Identifier, right 是NumericLiteralUnaryExpression, operator 可以是"-", "+"之类., 现在我们只需要找到这个 left 和 right 对应的值是多少就计算出该表达式的具体数值. 使用 path.scope 可以获取到作用域内变量的定义和初始值/是否常量等信息, 可以找到初始值, 找一个Identifier的初始值的方法类似如下代码:

function getIdentifierNumber(identifier, scope) {
    // scope: 作用域

    // 得到binding
    const binding = scope.getBinding(identifier.name);
    if (!binding) {
        return;
    }

    // 当前变量是常量且初始值是数值类型则可以得到数值
    if (binding.constant && types.isNumericLiteral(binding.path.node.init)) {
        return binding.path.node.init.value;
    }

      // 初始值是null且只有一个constantViolations且是数值
    if (binding.path.node.init === null && binding.constantViolations.length === 1) {
        const node = binding.constantViolations[0].node;
        if (!types.isAssignmentExpression(node)) {
            return;
        }
        return tryGetArgNumber(node.right, binding.constantViolations[0].scope);
    }
}

BinaryExpression表达式可以分别计算 left 和 right 的值, 然后根据 operator 计算数值; isUnaryExpression可以计算 argument 的值并计算数值.

function tryGetArgNumber(arg, scope) {

    // 数值类型直接取value即可
    if (types.isNumericLiteral(arg)) {
        return arg.value;
    }

    // 变量类型查找所在变量的binding, 并获取初始值
    if (types.isIdentifier(arg)) {
        return getIdentifierNumber(arg, scope);
    }

    // UnaryExpression类型只需要获取UnaryExpression的argument并进行operator操作就可以得到数值
    if (types.isUnaryExpression(arg)) {
        const argumentValue = tryGetArgNumber(arg.argument, scope);
        if (typeof argumentValue !== "number") {
            return;
        }
        return eval(`${arg.operator} ${argumentValue}`)
    }

          // 计算left和right的值
    if (types.isBinaryExpression(arg)) {

        let leftValue = tryGetArgNumber(arg.left, scope);
        const rightValue = tryGetArgNumber(arg.right, scope);
        if (typeof leftValue !== "number" || typeof rightValue !== "number") {
            return ;
        }
        return eval(`${leftValue} ${arg.operator} ${rightValue}`);
    }

}

对于传入参数是 param 类型即传入的是当前函数的参数, 可以获取当前函数的所有调用记录并加上一个偏移值, 然后继续加入到 to_visit 数组中遍历.
举个例子, 有如下函数定义:

function ob(e, t) {
  return kA(e + 100, t);
}

const result = ob(100, 0);

那么result=ob(100, 0)=kA(200, 0)="逆向研究点滴"

示例解析代码如下:

function getIdentifierNumber(identifier, scope) {
    // scope: 作用域

    // 得到binding
    const binding = scope.getBinding(identifier.name);
    if (!binding) {
        return;
    }

    // 当前变量是常量且初始值是数值类型则可以得到数值
    if (binding.constant && types.isNumericLiteral(binding.path.node.init)) {
        return binding.path.node.init.value;
    }

    // 初始值是null且只有一个constantViolations且是数值
    if (binding.path.node.init === null && binding.constantViolations.length === 1) {
        const node = binding.constantViolations[0].node;
        if (!types.isAssignmentExpression(node)) {
            return;
        }
        return tryGetArgNumber(node.right, binding.constantViolations[0].scope);
    }
}

function tryGetArgNumber(arg, scope) {

    // 数值类型直接取value即可
    if (types.isNumericLiteral(arg)) {
        return arg.value;
    }

    // 变量类型查找所在变量的binding, 并获取初始值
    if (types.isIdentifier(arg)) {
        return getIdentifierNumber(arg, scope);
    }

    // UnaryExpression类型只需要获取UnaryExpression的argument并进行operator操作就可以得到数值
    if (types.isUnaryExpression(arg)) {
        const argumentValue = tryGetArgNumber(arg.argument, scope);
        if (typeof argumentValue !== "number") {
            return;
        }
        return eval(`${arg.operator} ${argumentValue}`)
    }

    // 计算left和right的值
    if (types.isBinaryExpression(arg)) {

        let leftValue = tryGetArgNumber(arg.left, scope);
        const rightValue = tryGetArgNumber(arg.right, scope);
        if (typeof leftValue !== "number" || typeof rightValue !== "number") {
            return ;
        }
        return eval(`${leftValue} ${arg.operator} ${rightValue}`);
    }

    if (types.isMemberExpression(arg)) {
        let objectBinding = scope.getBinding(arg.object.name);
        let objectInit = objectBinding.path.node.init;
        // 一直查找到初始化值的地方
        while (types.isIdentifier(objectInit)) {
            objectBinding = objectBinding.scope.getBinding(objectInit.name);
            objectInit = objectBinding.path.node.init;
        }

        const targetName = arg.property.name;

        if (types.isObjectExpression(objectInit)) {
            const properties = objectInit.properties;
            for (const p of properties) {
                if (p.key.name === targetName) {
                    // 找到object类型的数值
                    return tryGetArgNumber(p.value, objectBinding.scope);
                }
            }

            // 可能object的属性在赋值语句中设置的, 遍历一下所有赋值语句
            for (const ref of objectBinding.referencePaths) {
                // 不是赋值语句跳过
                if (!types.isAssignmentExpression(ref.parentPath.parent)) {
                    continue;
                }
                const assign = ref.parentPath.parent;
                if (!types.isMemberExpression(assign.left)) {
                    continue;
                }
                if ((assign.left.property.name || assign.left.property.value) === targetName) {
                    return tryGetArgNumber(assign.right, ref.scope);
                }
            }

        }
    }

}

function handleStringFunction(path) {
    const { node } = path;

    // 找到kA函数
    if (node.id.name !== "kA" || node.params.length !== 2) {
        return;
    }

          // 这里仅是示例代码, 不提供完整kAWords数组, 按照前面的方法可以得到这个kAWords数组并填充进来
    const kAWords = [];

    // 得到当前kA函数定义处所在的父类作用域中查找kA函数的binding
    const binding = path.parentPath.scope.getBinding(node.id.name);
    // 找出所有引用stringFunction的地方
    const references = binding.referencePaths;
    const to_visit = [];

    for (const ref of references) {
        // 1. 若引用kA的parent是一个CallExpression, 查看其第一个参数, 根据第一个参数的类型来决定
        if (types.isCallExpression(ref.parent)) {
            to_visit.push([ref.parentPath, ref.parent, 0, ref.parentPath.scope, 0]);
        }
    }

    while (to_visit.length > 0) {
        const [callExpressionPath, callExpression, argIndex, scope, offset] = to_visit.shift();
        const targetArg = callExpression.arguments[argIndex];
        const value = tryGetArgNumber(targetArg, scope);
        if (typeof value === "number") {
            const word = kAWords[value+offset];
            if (word) {
                callExpressionPath.replaceWith(types.stringLiteral(word));
                console.log(`${generator(callExpression).code} 变更为字符串: ${word}`);
            } else {
                debugger;
            }
        } else if(types.isBinaryExpression(targetArg) && types.isIdentifier(targetArg.left)) {
            // targetArg是BinaryExpression且left是param类型变量, 则需要继续找到所在函数并添加所有该函数的调用到to_visit中继续查找.
            const leftBinding = scope.getBinding(targetArg.left.name);
            const rightValue = tryGetArgNumber(targetArg.right, scope);
            if (leftBinding.kind === "param" && typeof rightValue === "number") {
                const func = scope.getFunctionParent();
                const funcName = func.path.node.id.name;

                const funcBinding = func.path.parentPath.scope.getBinding(funcName);
                const funcReferences = funcBinding.referencePaths;

                // 计算left是func的第几个参数
                const leftIndex = func.path.node.params.indexOf(leftBinding.path.node);

                // 计算新的偏移值
                const newOffset = eval(`${targetArg.operator} ${rightValue}`) + offset;

                for (const ref of funcReferences) {
                    if (types.isCallExpression(ref.parent)) {
                        to_visit.push([ref.parentPath, ref.parent, leftIndex, ref.parentPath.scope, newOffset]);
                    }
                }
            }
        }

    }
}

替换完成后写入新的 js 文件

const { code } = generator(ast);

fs.writeFileSync("js_security_v3_0.1.6.example.js", code);

1713070477131-346739a8-419f-45bf-b321-02032b0435c3.png
1713071272557-f95d5862-689d-4a8d-a949-40acf44c8c71.png
1713072121700-806da9e2-ee97-4ab5-b96f-ec20b3c2e6f9.png
1713072145352-5645a336-1876-4133-ad53-7871be4b0c08.png

可以查看前后文件的对比, 可以知道已经对很多字符串函数替换为字符串, 不过也有一部分没有替换成功, 分析可以发现并不是所有字符串函数都是基于kA函数得到, 不过解决思路是一致的,仅需要把 kAWords 数组替换成对应的即可, 替换完成后效果如下:
1713076090527-98b4a849-dfac-418b-8758-851dae596a54.png
然后稍微整理一下一些跟字符串相关的看上去很费解的结构, 例如多个字符串相加或者 MemberExpression 的 property 是一个 sequenceExpression 但是实际有用的只有最后的字符串.
1713079300044-76884725-b928-461d-ad95-6a637fd0f7a7.png
1713079403699-dc63275f-e662-4b37-bb4a-b1c79292e817.png


function handleBinaryExpressionString(path) {
// 去除多个字符串相加或常量相加的情况, 直接使用path.evaluate()即可. babel会计算好结果.
  const { confident, value } = path.evaluate();
    if (confident) {
        path.replaceInline(types.valueToNode(value));
    }
}

// 去除MemberExpression的property是一个sequenceExpression的情况
function removeSequenceExpressionForString(path) {
    const { node } = path;
    if (!types.isSequenceExpression(node.property)) {
        return;
    }
    const expressions = node.property.expressions;
    if (!types.isStringLiteral(expressions[expressions.length - 1])) {
        return;
    }
    path.replaceWith(types.memberExpression(node.object, expressions[expressions.length - 1], true));
}

1713079742785-ec779723-1237-4180-8b28-843dab4d1fc3.png
以下是替换之后的效果:
1713079785670-dbf31992-9332-4ebb-bfd0-f0c4c0470749.png

1.2 还原控制流

继续分析字符串函数还原后的代码可以知道, 代码中有很多如下这种格式的控制流结构, for-switch 的形式, switch 的是一个字符数组, 根据匹配的字符顺序进行还原即可.
1713080108672-a206b85f-bf85-4ebf-9107-2b2732424402.png
首先找出用于 switch 的字符串数组:

function handleControlFlow(path) {
    const { node } = path;
    if (!types.isBlockStatement(node.body) || node.body.body.length < 1 || !types.isSwitchStatement(node.body.body[0])) {
        return;
    }
    const switchStatement = node.body.body[0];
    if (!types.isMemberExpression(switchStatement.discriminant)) {
        return;
    }

    // 找到discriminant变量的binding, 从而获得初始值.
    const stepVarBinding = path.scope.getBinding(switchStatement.discriminant.object.name);
    const stepVar = stepVarBinding.path.node.init.callee.object;

   // tryGetValue跟上面的tryGetArgNumber原理差不多, 不过这里拿的是stringLiteral类型.
    const value = tryGetValue(stepVarBinding.scope, stepVar);

    if (!value) {
        return;
    }

    if (typeof value !== "string") {
        return;
    }

          // 得到字符数组
    const steps = value.split("|");
}

拿到字符数组之后只需要按照字符数组的顺序重新编排代码块顺序即可, 然后替换整个 for 循环:

function handleControlFlow(path) {
    // ...上面的代码

    const cases = {};
    for (const c of switchStatement.cases) {
        cases[c.test.value] = c;
    }

    const blocks = [];

    for (const step of steps) {
        const switchCase = cases[step];
        let consequent = switchCase.consequent;
        const lastNode = consequent[consequent.length - 1];
        if (types.isContinueStatement(lastNode) || types.isBreakStatement(lastNode)) {
            consequent = consequent.slice(0, consequent.length - 1);
        }
        blocks.push(...consequent);
    }

    path.replaceWithMultiple(blocks);

}

// ...
traverse(ast, {
    ForStatement: {
        exit: [
            handleControlFlow
        ]
    }
});

前后代码对比:
1713080864025-e467ae24-559f-4d08-a860-bd3627d3e7dc.png

1.3 还原仅有一句表达式代码的函数

1713084145098-d9ebbd91-be09-4d2e-bbdf-91c5e5c2681c.png
1713084160758-ac5ef13d-81c6-4422-9a49-3d92dff28444.png
1713084820425-6f03e966-cfef-4738-9229-39811857f836.png
1713084842806-bd587db6-a3d1-4025-99df-810481db3eee.png

全文 js 代码中有大量像上图xtLZB这样的函数, 这些函数作用仅仅是对传入的参数做某一种操作并且只有一行 return 代码, 它们的目的仅仅是用于增加代码的阅读难度, 所以可以将这些函数调用的节点替换为 return 中表达式的节点.
例如:

var ut = {
        xtLZB: function (t, r, n, e) {
                return t(r, n, e);
              }
};

// ...
Xt = ut.xtLZB(Fg, Jt, null, 2)

替换为:

Xt = Fg(Jt, null, 2);

去除xtLZB函数调用后, 代码看上去会简洁很多.
首先先筛选出符合上述特征的函数调用: 函数是只有一行代码且是 return 语句或者除了 return 语句外, 还有一行是无用的 var 语句.

function handleSimpleCallExpression(path) {

    const {node} = path;
    if (!types.isMemberExpression(node.callee) || !types.isIdentifier(node.callee.object)) {
        return;
    }
    const calleeBinding = path.scope.getBinding(node.callee.object.name);
    if (!calleeBinding) {
        return;
    }
    let func = null;
    let funcScope = null;

    function tryGetFunction(v, scope, targetName, binding) {
        if (types.isIdentifier(v)) {
            binding = scope.getBinding(v.name);
            if (binding.kind === "param") {
                return;
            }
            return tryGetFunction(binding.path.node.init, binding.scope, targetName, binding);
        }
        if (types.isObjectExpression(v)) {
            const properties = v.properties;
            for (const pro of properties) {
                if (pro.key.name === targetName) {
                    return [pro.value, scope];
                }
            }

            if (!binding) {
                return ;
            }

            // 从赋值语句中查找
            for (const ref of binding.referencePaths) {
                if (!types.isAssignmentExpression(ref.parentPath.parent)) {
                    continue;
                }
                const assign = ref.parentPath.parent;
                if (!types.isMemberExpression(assign.left)) {
                    continue;
                }
                if ((assign.left.property.name || assign.left.property.value) === targetName) {
                    return [assign.right, ref.parentPath.parentPath.scope];
                }
            }
        }
    }

    const targetName = node.callee.property.name || node.callee.property.value;
    const info = tryGetFunction(calleeBinding.path.node.init, calleeBinding.scope, targetName);
    if (Array.isArray(info)) {
        func = info[0];
        funcScope = info[1];
    }

    if (func === null || funcScope === null) {
        return;
    }
    if (!types.isFunctionExpression(func)) {
        return;
    }
}

之后开始替换这些函数调用节点为表达式节点:

function handleSimpleCallExpression(path) {
  // ... 上面的代码
  // 寻找function的path
    let funcPath = null;
    funcScope.path.traverse({
        FunctionExpression: function (mpath) {
            const {node: mnode} = mpath;
            if (mnode === func) {
                funcPath = mpath;
                mpath.skip();
            }
        }
    });

    if (funcPath === null) {
        return;
    }

    // 得到传入参数节点和函数参数节点的对应关系, 准备将return表达式中的所有设计这些函数参数的替换为实际的传入参数.
    const paramToArgument = {};
    for (let i = 0; i < func.params.length; i++) {
        const param = func.params[i];
        const argument = node.arguments[i];
        if (typeof argument === "undefined") {
            break;
        }
        paramToArgument[param.name] = argument;
    }

    const beforeCode = generator(node).code;

    // 替换先实现保留原来的function定义
    const originalFunc = types.cloneNode(func, true);

    // 遍历替换对应节点
    funcPath.traverse({
        Identifier: function (mpath) {
            const { node: mnode } = mpath;
            if (paramToArgument[mnode.name]) {
                mpath.replaceWith(paramToArgument[mnode.name]);
                mpath.skip();
            }
        }
    });

    const afterCode = generator(funcPath.node.body.body[0].argument).code;

    // 替换函数调用为return语句中的argument表达式
    path.replaceInline(returnStatement.argument);

    // 还原原来的function
    funcPath.replaceInline(originalFunc);

    console.log(`简化函数调用: ${beforeCode.slice(0, 10)}... -> ${afterCode.slice(0, 10)}...`);
}

前后对比:
1713085410033-56d6a36e-d85f-4c68-bad0-4628d6aac39d.png

参数分析

去混淆之后 Enable Local Overrides, 将原 js_security_v3_0.1.6.js 替换为去混淆之后的 js 代码.
1713085891098-35c83b58-d2a8-4bf7-b5d3-2587bff8110c.png
全文搜索"h5st", 得到两处相关代码, 通过分析知道 h5st 来自__genSignParams函数, 打上断点分析.
1713087033822-7e815c72-5026-45a7-a67f-7f4dbadc7433.png
1713086143601-4137d0ca-06cf-449b-9e71-790676ae5975.png
1713087134959-3eca3c93-85b0-4568-8b0e-5d7d0a27d806.png
__genSignParams函数是对传入的 A, C, c, r 进行拼接, 其中关键代码:

var C = pw();
var c = Db(C, "yyyyMMddhhmmssSSS");
var v = c + "22";
var s = this["__genKey"](this["_token"], this["_fingerprint"], v, this["_appId"], this["algos"])["toString"]();
var A = this.__genSign(s, t);

另外 r 和 t 参数都是传入参数.
1713086584031-c7f89e0e-cecb-4c56-8062-9e7c6323e715.png
依次对这些变量进行研究

2.1 pw 函数

如下, 是Date.now函数:
1713086732097-1f83ee31-2606-48ce-9634-53c1f7b2649e.png

2.2 c 参数

var c = Db(C, "yyyyMMddhhmmssSSS");

1713087532961-628e0c2c-dc85-4360-9c3d-25b796fa2b35.png
可以明显看出是获取 C 变量(也就是当前时间)的日期字符串, 格式是yyyyMMddhhmmssSSS.

2.3 s 参数

var s = this["__genKey"](this["_token"], this["_fingerprint"], v, this["_appId"], this["algos"])["toString"]();

1713087924235-f06d6ca5-85cc-480b-976f-a0c17f556bb1.png

简单跟一下__genKey函数代码, 发现是 VM 加载的 js 代码, 这段代码定义了使用哪种hamc签名算法, 在js_security_v3_0.1.6.js代码中搜一下关键词__genKey可以找到加载代码的位置.
1713088132854-450b9416-81a1-4b4f-a430-85cf673f19b8.png
在该位置打上断点, 分析下该代码的来源.
1713088284096-ffa3530d-ffa1-45dd-9b9e-8a3d2476082a.png
1713088451059-9f495f97-6aae-490d-a58d-0859056e972f.png
可以知道, 这段 js 代码来自 storage 的WQ_dy_algo_s_f06cc_4.3, 另外的WQ_dy_tk_s_f06cc_4.3是 token. 把当前 local storage 清空, 刷新请求, 可以发现有个请求返回了这些内容:
1713089483316-e6170760-92b5-46f0-9f04-41903702ba91.png
1713089521905-a2cad477-a127-43b8-a0cb-92c69cefa070.png
可以全文搜索解混淆之后的 js 代码, 关键词为请求体中的expandParams, 分析其中所有参数的生成逻辑, 就是一些环境检测的参数, 然后使用了 aes 加密得到 hex 字符串, 在此不详细展开了.
1713089598445-2b8be7d4-e832-4815-aa17-aec31a1eb9d8.png
1713089795840-afdad2a0-7e6e-4551-aa2f-15d56cf9e31d.png

2.4 A 参数

var A = this.__genSign(s, t);

1713094128669-f263aee1-c056-460a-aa56-9d4fe79ac5ca.png
1713094744019-37cf14c8-528e-44f0-bf5f-39a9e46b4eab.png
1713094697085-742ea53b-bc73-4ec5-8782-c1a006510830.png
1713095321420-0d095423-5cac-4407-ae36-c66cae6f228b.png

通过跟踪__genSign->Zb知道, A是计算拼接字符串的HmacSHA256签名, 其中salt是2.3 s参数, 字符串由传入参数t拼接得到, 拼接示例数据如下:

[{"key":"appid","value":"search-pc-java"},{"key":"body","value":"4003786fdc49eae4d371309b4e42395f38e243887e470fe2cef2733dc03581c3"},{"key":"client","value":"pc"},{"key":"clientVersion","value":"1.0.0"},{"key":"functionId","value":"mixerOut"},{"key":"t","value":1713089999455}]

拼接成appid:search-pc-java&body:xxxxxx&client:pc&clientVersion:1.0.0&functionId:mixerOut&t:1713089999455

2.5 t参数

1713095981444-1db9c2df-97bc-4ba8-8438-f05cf705ced7.png
1713096072510-78045977-a0d5-4108-a6d2-7028b65bed62.png
t是传入的参数, 在调用栈上一层知道来自V=t["sent"], 当前在case 8处, 它的上一步是case 5, 在case 5这段代码处打上断点, 根据这个Promise函数的特性, 每一步的sent参数是由上一步的t["abrupt"]("return", xxx);得到的, 因此在这个abrupt函数上打上断点, 在case 5到case 8之间停留的最后一次abrupt函数就是V变量设置的代码位置(注意是最后一次, 因为代码中可能有多处这种Promise函数调用).
1713096887223-402811a8-e814-4e7d-91bb-c4c863094d74.png
1713097090007-cb55065a-c9e3-4dc8-8bcc-ea0ce4d1ec11.png

经过case5到case8的最后一次abrupt的断点, 可以看到V=t["sent"]的生成代码逻辑:
1713097320297-c1c8d6ef-5cb2-4e53-aa39-169fe3bed83d.png
1713097351194-300d0495-bc1a-4245-aa99-cce4b5aefff5.png
1713097426100-db7952c1-edd3-477c-b2e8-65cc9c71eed2.png
经过分析可以知道, 这是对一个K变量字符串进行aes加密, aes key是"&d74&yWoV.EYbWbZ", iv是["01", "02", "03", "04", "05", "06", "07", "08"]["join"]("")得到. 其中K是一些环境检测:
1713097615438-03965101-078c-4e70-8a37-0cd90a126d72.png
通过全文搜索"sua"关键词可以找到这些环境检测代码逻辑所在, 在此不详细展开了:
1713097702528-ffdf1eb8-158d-49be-9d52-cf2f9ba0100d.png
值得注意的是参与h5st时的环境检测变量只有: sua/pp/extend/random/v/fp这几个.
以下是检测的环境参数:

参数名 类型 说明
wc number 是否Chrome浏览器(是: 1, 否: 0)
wd number 是否有webdriver属性(是: 1, 否: 0)
l string 当前语言: navigator["language"]
ls string 支持的语言列表: navigator["languages"].join(",")
ml number navigator["mimeTypes"]["length"]
pl number 插件数量: navigator["plugins"].length
av number navigator.appVersion
ua string window["navigator"]["userAgent"]
sua string 使用正则RegExp("Mozilla/5.0 \((.*?)\)")取出useragent内容
pp object 取cookie对应值, 没有就不设置, p1: pwdt_id, p2: pin, p3: pt_pin
extend object 环境相关检测

extend检测的关键逻辑代码为:

var  Sr = {};

Sr.wd = window["navigator"]["webdriver"] ? 1 : 0;

Sr.l = navigator.languages && 0 !== navigator["languages"]["length"] ? 0 : 1;

Sr.ls = navigator["plugins"]["length"];

Br = 0;
("cdc_adoQpoasnfa76pfcZLmcfl_Array" in window || "cdc_adoQpoasnfa76pfcZLmcfl_Promise" in window || "cdc_adoQpoasnfa76pfcZLmcfl_Symbol" in window) && (Br |= 1);
("$chrome_asyncScriptInfo" in window["document"] || "$cdc_asdjflasutopfhvcZLmcfl_" in window["document"]) && (Br |= 2);
Sr.wk = Br;

Sr["bu1"] = "0.1.6";

Or = 0;
Er = -1 !== gg(_r = window.location["host"]).call(_r, "sz.jd.com") || gg(jr = window.location["host"])["call"](jr, "ppzh.jd.com") !== -1;
Er && gg(Lr = document["body"]["innerHTML"]).call(Lr, "diantoushi.com") !== -1 && (Or |= 1);
Er && -1 !== gg(Mr = document.body["innerHTML"])["call"](Mr, "xiaowangshen.com") && (Or |= 2);
Sr["bu2"] = Or;

Sr["bu3"] = document["head"]["childElementCount"];

kr = 0;
Tr = typeof process !== "undefined" && process["release"] != null && process["release"].name === "node";
Pr = typeof process !== "undefined" && process["versions"] != null && process["versions"]["node"] != null;
Ir = typeof Deno !== "undefined" && typeof Deno.version !== "undefined" && void 0 !== Deno["version"]["deno"];
Wr = typeof Bun !== "undefined";
(Tr || Pr) && (kr |= 1);
Ir && (kr |= 2);
Wr && (kr |= 4);
Sr["bu4"] = kr;

感悟总结

h5st整体难度不高, 不大熟悉如何使用babel操作ast的朋友可以用来练手熟悉. 本人最近才开始写逆向文章, 写作思路不是很熟练, 望海涵.
ps: 吾爱破解论坛的markdown的图片链接貌似不会自动上传到站内图片链接, 凑活用.

免费评分

参与人数 23吾爱币 +29 热心值 +19 收起 理由
T4DNA + 1 + 1 谢谢@Thanks!
笙若 + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
PowerKing + 1 + 1 欢迎分析讨论交流,吾爱破解论坛有你更精彩!
qiucx + 1 用心讨论,共获提升!
mushan2000 + 1 + 1 我很赞同!
chenwen6 + 1 + 1 谢谢@Thanks!
timeslover + 2 用心讨论,共获提升!
无知灰灰 + 3 + 1 用心讨论,共获提升!
fanssong + 3 + 1 感谢无私奉献,又进步了一大块
fengbolee + 2 + 1 欢迎分析讨论交流,吾爱破解论坛有你更精彩!
hopecolor514 + 1 我很赞同!
QAQ~QL + 1 + 1 我很赞同!
156608225 + 2 + 1 鼓励转贴优秀软件安全工具和文档!
二十瞬 + 1 + 1 我很赞同!
fengchuan + 1 + 1 用心讨论,共获提升!
allspark + 1 + 1 用心讨论,共获提升!
Rummy + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
Courser + 1 + 1 谢谢@Thanks!
xoyi + 1 我很赞同!
hygzs + 1 用心讨论,共获提升!
3yu3 + 1 + 1 用心讨论,共获提升!
子时落尽 + 1 + 1 谢谢@Thanks!
kittylang + 1 + 1 欢迎分析讨论交流,吾爱破解论坛有你更精彩!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

Hmily 发表于 2024-4-19 15:57
@kylin1020 很抱歉,论坛Markdown并不会自行去下载图片,这有很大的安全隐患,并且论坛已经强制走了SSL加密,由于你帖子使用的图床是http的,浏览器会直接禁止加载,最起码图床需要支持https,最好是可以把图片上传论坛本地,贴图的方法参看:https://www.52pojie.cn/misc.php? ... &id=29&messageid=36 ,这次我帮你编辑上传了,下次可以自行处理一下。
cmsttasd 发表于 2024-4-15 09:09
cld61 发表于 2024-4-15 09:31
grant73 发表于 2024-4-15 09:46
ast一直不得要领啊,mark学习一下
tunnel213 发表于 2024-4-15 09:51
大佬的感悟总结对小白是杀人诛心啊
pojie20230721 发表于 2024-4-15 10:18
看不大懂, 收藏待学
BonnieRan 发表于 2024-4-15 10:51
哇~ ast解混淆的过程很详细,如楼主说的正好拿来练手熟悉babel操作ast
LittleHedgehog 发表于 2024-4-15 12:00
收藏学习
WuAi2024AiWu 发表于 2024-4-15 18:41
厉害&#128077;
yyysss153 发表于 2024-4-16 08:06
感谢分享
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2025-1-15 12:27

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表