【使用Hook技术让JS逆向少掉几根头发】猿人学爬虫攻防赛第五题详解

天空宫阙 发表于 2020-12-16 12:13

本帖最后由天空宫阙于 2020-12-16 13:24 编辑

猿人学第5题
题目地址http://match.yuanrenxue.com/match/5

1.定位加密位置
找到有数据返回的请求发现有两个参数m和f并且cookie中有两个值 m 和 RM4hZBv0dDon443M

经过测试cookie中的m和RM4hZBv0dDon443M是**必要的**并且**名称不会发生变化**

此时可以通过搜索 RM4hZBv0dDon443M m m= m: 寻找入口，但是这题是搜不到的。

通过hook cookie中 RM4hZBv0dDon443M 的赋值寻找入口

随便找一个大部分js执行前下一个断点（此时cookie为空）

注入下面代码

var cookie_cache = document.cookie;
Object.defineProperty(document, 'cookie', {
get: function() {
   console.log('Getting cookie');
   return cookie_cache;
},
set: function(val) {
   console.log('Setting cookie', val);
   // hook指定cookie键
   if(val.search('RM4hZBv0dDon443M') !=-1 ){
         debugger
   }
   var cookie = val.split(";");
   var ncookie = cookie.split("=");
   var flag = false;
   var cache = cookie_cache.split("; ");
   cache = cache.map(function(a){
         if (a.split("=") === ncookie){
            flag = true;
            return cookie;
         }
         return a;
   })
   cookie_cache = cache.join("; ");
   if (!flag){
         cookie_cache += cookie + "; ";
   }
   this._value = val;
   return cookie_cache;
},
});

按F8进行调试在操作cookie并且其中有RM4hZBv0dDon443M时会进入断点，第三次进入断点时RM4hZBv0dDon443M有值

此时根据调用栈往下找成功找到RM4hZBv0dDon443M赋值的地方

其中`_$8K`是window `_$ss`是window的一个属性，此时可以搜索`_$ss`没有结果，可以挨个分析`_$8K`但有66处结果比较多，此时再次使用hook技术hook window 的`_$ss`属性

hook的注入点，在RM4hZBv0dDon443M生成的vm文件前面随便下一个断点，或者使用之前那个hook注入点也行,注入一下代码。
Object.defineProperty(window, "_$ss", {
set: function (e) {
   console.log('set _$ss', e)
   debugger
   return e;
}
})
2.核心加密逻辑分析
成功hook到`_$ss`赋值的地方，同样的根据调用栈往下追可以看到`_$ss`赋值的地方

同时此时也是核心加密的位置

把鼠标放到对应位置可以看到这些字符串具体的值
还原后的代码

_$Ww = _$Tk["enc"]["Utf8"]["parse"](window['_$pr']["toString"]()),
_$Wu = _$Tk["AES"]["encrypt"](_$Ww, window["_$qF"], {
'mode': _$Tk["mode"]["ECB"],
'padding': _$Tk["pad"]["Pkcs7"]
}),
window['_$ss'] = _$Wu["toString"]();

发现是AES加密ECB/Pkcs7，
**加密的内容**是_$pr这个数组toString的结果
**秘钥**是_$qF
_$pr _$qF 都可以直接搜到

**密钥**_$qF 是请求中的参数m这个时间戳经过base64编码再取前十六位

**加密的内容**是_$pr这个数组push了5次
push的内容是时间戳进过函数b处理后的结果

所有逻辑就很清楚了但是**还有一个巨坑**函数b的受到全局变量 `_$Jy` `_$tT` `_$6_`的影响
hook一下函数b看看哈希前后的值。

并对比请求时的参数m和f，发现**m的哈希在加密的内容中**，f并没有出现在加密的内容中，**其他时间戳并没有发送给服务器**，因此猜测只要加密的内容中只要最后一位是m的b处理结果即可，f只要给个当前时间即可，函数b也只需要扣最后一次哈希m的即可。（之后测试猜测是准确的，当然也可以完全模拟，若要完全模拟b函数需要传入_$Jy _$tT _$6_作为参数）。

确定哈希m时函数b执行时 _$Jy _$tT _$6_的值，同样适用hook

(function hook_g() {
var new_g = g;
g = function (e) {
   var ret = new_g(e);
   // debugger
   console.log('_$Jy',_$Jy,'_$tT',_$tT,'_$6_',_$6_)
   console.log("加密前:", e, "加密后:", ret);
   return ret;
}
})();

3.最终代码

https://github.com/skygongque/match-yuanrenxue/tree/master/match05

4.成功留念

5.参考思路有参考B站的视频 BV1yz4y1o7Ex，是个大佬，讲解逻辑非常清晰

林中月 发表于 2021-2-26 15:27

学习了学习了，感谢

天空宫阙 发表于 2021-3-31 22:32

dych1688 发表于 2021-3-31 12:56
随便找一个大部分js执行前下一个断点（此时cookie为空）

看后面的图就是随意找的一个断点，清楚cookie后刷新，断下来后打印一下cookie为空此时就可以注入hook cookie生成的代码

wysyz 发表于 2020-12-16 12:27

膜拜大佬。。。

304775988 发表于 2020-12-16 13:20

楼主强大,功力太深,望尘莫及呀{:1_899:}

天空宫阙 发表于 2020-12-16 13:29

304775988 发表于 2020-12-16 13:20
楼主强大,功力太深,望尘莫及呀

还在学习中，其实如果使用AST（抽象语法树）解混淆，那些搜不到的参数就可以搜到了；使用hook算是另一种方案。

天空宫阙 发表于 2020-12-16 14:53

Summer大大发表于 2020-12-16 14:25
一般加密都是在请求体，cookie里面放加密好像很少见，也有的是放请求头里面的

放cookie里也是比较常见的反爬方式，有些网站甚至是结合起来用的请求的参数和cookie里都有加密的字段。

天空宫阙 发表于 2020-12-18 09:39

就算被置顶也没人看太真实了吧

xixicoco 发表于 2020-12-18 12:23

好东西，我仔细看了，谢谢楼主

dwh007 发表于 2020-12-21 21:18

天空宫阙发表于 2020-12-18 09:39
就算被置顶也没人看太真实了吧

大大，有无更全面的JS解密教程或资料？谢谢

hellostranger 发表于 2021-3-3 17:51

学到了，以前我也想过这样劫持变量，但是没有想到怎么注入，原来可以打断点再操作

页: [1] 2 3

吾爱破解 - 52pojie.cn's Archiver

【使用Hook技术让JS逆向少掉几根头发】 猿人学爬虫攻防赛 第五题详解

【使用Hook技术让JS逆向少掉几根头发】猿人学爬虫攻防赛第五题详解