萌新对VMP的分析

Shocker 发表于 2021-8-19 12:06

## 前言
本文以萌新的角度来分析VMP壳,不涉及到VM的任何概念,算是VMP的入门贴.
#### 分析环境:
windows 10+IDA 7.5+VS 2019+
VMProtect_Ultimate_v3.5.0_x32_Build_1213_Retail_Licensed
## 环境搭建
声明裸函数nake_main,这个函数就是要加vm的函数
```
__declspec(naked) void nake_main() {
_asm mov eax, 0x12345678;
_asm ret;
}
int main()
{
nake_main();
}
```
函数逻辑很简单,就是给eax赋值0x12345678然后返回.
VS2019编译,
加壳

可以看到,整个函数已经被vm了.

### 记录指令
用IDA trace脚本跟踪函数进虚拟机直到出虚拟机所执行的指令,并将指令的二进制记录到文件中.**注意下断点**

**注意要替换所有的call指令为call +5,把retn指令替换为lea esp,.**
```
#---------------------------------------------------------------------
# Debug notification hook test
#
# This script start the executable and steps through the first five
# instructions. Each instruction is disassembled after execution.
#
# Original Author: Gergely Erdelyi <gergely.erdelyi@d-dome.net>
#
# Maintained By: IDAPython Team
#
#---------------------------------------------------------------------
import idc
from idaapi import *
import binascii
import struct

from capstone import *
md=Cs(CS_ARCH_X86,CS_MODE_32)

class MyDbgHook(DBG_Hooks):
""" Own debug hook class that implementd the callback functions """

def dbg_process_start(self, pid, tid, ea, name, base, size):
   print("Process started, pid=%d tid=%d name=%s" % (pid, tid, name))
   self.asmfile=open('dump.asm','wb') #保存记录指令的文件
   self.record_count=0

def dbg_process_exit(self, pid, tid, ea, code):
   print("Process exited pid=%d tid=%d ea=0x%x code=%d" % (pid, tid, ea, code))
   if not self.asmfile ==None:
         self.asmfile.close()

# def dbg_library_unload(self, pid, tid, ea, info):
# print("Library unloaded: pid=%d tid=%d ea=0x%x info=%s" % (pid, tid, ea, info))
# return 0

# def dbg_process_attach(self, pid, tid, ea, name, base, size):
# print("Process attach pid=%d tid=%d ea=0x%x name=%s base=%x size=%x" % (pid, tid, ea, name, base, size))

# def dbg_process_detach(self, pid, tid, ea):
# print("Process detached, pid=%d tid=%d ea=0x%x" % (pid, tid, ea))
# return 0

# def dbg_library_load(self, pid, tid, ea, name, base, size):
# print ("Library loaded: pid=%d tid=%d name=%s base=%x" % (pid, tid, name, base))

def dbg_bpt(self, tid, ea):
   print("0x%x %s" % (ea, GetDisasm(ea)))
   codelen=get_item_size(ea)
   self.record_count=self.record_count+codelen
   b=get_bytes(ea,codelen)
   self.asmfile.write(b)
   self.asmfile.flush()
   # return values:
   # -1 - to display a breakpoint warning dialog
   #    if the process is suspended.
   # 0 - to never display a breakpoint warning dialog.
   # 1 - to always display a breakpoint warning dialog.
   return 0

# def dbg_suspend_process(self):
# print ("Process suspended")

# def dbg_exception(self, pid, tid, ea, exc_code, exc_can_cont, exc_ea, exc_info):
# print("Exception: pid=%d tid=%d ea=0x%x exc_code=0x%x can_continue=%d exc_ea=0x%x exc_info=%s" % (
#       pid, tid, ea, exc_code & idaapi.BADADDR, exc_can_cont, exc_ea, exc_info))
# # return values:
# # -1 - to display an exception warning dialog
# #    if the process is suspended.
# # 0- to never display an exception warning dialog.
# # 1- to always display an exception warning dialog.
# return 0

def dbg_trace(self, tid, ea):
   print("0x%x %s" % (ea, GetDisasm(ea)))
   if idc.print_insn_mnem(ea).startswith('j'): #不记录所有的跳转指令
         return 0

   if idc.print_insn_mnem(ea) == 'retn':#把retn 替换为lea esp,
         code=b'\x8D\x64\x24\x04' #lea esp,
         self.asmfile.write(code)
         self.asmfile.flush()
         self.record_count=self.record_count+len(code)
         return 0
   if idc.print_insn_mnem(ea) == 'call':#把call 替换为call +5
         fix_addr=0
         mnemonic=struct.pack('B',idc.get_wide_byte(ea))
         op=struct.pack('i',fix_addr)
         call_asm=mnemonic+op
         self.asmfile.write(call_asm)
         self.asmfile.flush()
         self.record_count=self.record_count+get_item_size(ea)
         return 0
   for addr in range(ea,idc.next_head(ea)):
         b=struct.pack('B',idc.get_wide_byte(addr))
         self.asmfile.write(b)
         self.asmfile.flush()
   self.record_count=self.record_count+get_item_size(ea)

   # eip = get_reg_value("EIP")
   # print("0x%x %s" % (eip, GetDisasm(eip)))
   # print("Trace tid=%d ea=0x%x" % (tid, ea))
   # return values:
   # 1- do not log this trace event;
   # 0- log it
   return 0

# def dbg_step_into(self):
# eip = get_reg_value("EIP")
# print("0x%x %s" % (eip, GetDisasm(eip)))

# def dbg_run_to(self, pid, tid=0, ea=0):
# print ("Runto: tid=%d" % tid)
# idaapi.continue_process()

# def dbg_step_over(self):
# eip = get_reg_value("EIP")
# print("0x%x %s" % (eip, GetDisasm(eip)))
# self.steps += 1
# if self.steps >= 5:
#       request_exit_process()
# else:
#       request_step_over()

# Remove an existing debug hook
try:
if debughook:
   print("Removing previous hook ...")
   debughook.unhook()
except:
pass

# Install the debug hook
debughook = MyDbgHook()
debughook.hook()
debughook.steps = 0

# Stop at the entry point
ep = get_inf_attr(INF_START_IP)
request_run_to(ep)

# Step one instruction
request_step_over()

# Start debugging
run_requests()
```
将记录后的指令文件用CFF_Explorer添加到原文件里

IDA打开找到对应地址,运行去混淆脚本
(https://www.52pojie.cn/thread-1491068-1-1.html)
将混淆指令去除后再合并,即可看到vm的代码

## 分析指令
```
seg005:0048D000             push 8FF9032Bh
seg005:0048D005             call $+5
seg005:0048D00A             push eax
seg005:0048D00B             push edx
seg005:0048D00C             pushf
seg005:0048D00D             push edi
seg005:0048D00E             push esi
seg005:0048D00F             push ebp
seg005:0048D010             push ecx
seg005:0048D011             push ebx
seg005:0048D012             mov edx, 0
seg005:0048D017             push edx          ; 保存寄存器
seg005:0048D018             mov edi, ; 就是0x8FF9032B,即进入虚拟机时push值,给edi
seg005:0048D01C             ror edi, 3
seg005:0048D01F             add edi, 4F581DEFh
seg005:0048D025             ror edi, 1
seg005:0048D027             bswap edi
seg005:0048D029             rol edi, 2
seg005:0048D02C             add edi, 55C970B6h
seg005:0048D032             add edi, edx    ; 对edi经过一系列运算,最后edi指向一片内存区域
seg005:0048D034             mov esi, esp    ; esi指向了保存所有寄存器的位置,指向上面push edx的edx的值
seg005:0048D036             sub esp, 0C0h    ; 将esp减去C0,为后面的mov ,eax,保留空间
seg005:0048D03C             mov ebx, edi
seg005:0048D03E             mov eax, 0
seg005:0048D043             sub ebx, eax    ; 这个ebx在后面每一个代码段里都有用
seg005:0048D045             lea ebp, loc_46ACC5 ; 这里ebp仅作跳转作用,即用来找到下一个要跳转的地址
```
这是进入vm的起始代码,这里主要是用push将进入虚拟机时原始的**eax,edx,eflags,edi,esi,ebp,ecx,ebx**保存到栈里,之后根据push的值(0x8FF9032B)做一系列运算给edi,使edi指向一片内存区域.

之后对ebx一系列操作,**ebx在之后的代码段都会做一次更新操作.**

```
seg005:0048D04B             mov eax,    ; 从edi的内存读取4字节
seg005:0048D04D             lea edi, ; edi+4
seg005:0048D053             xor eax, ebx
seg005:0048D055             dec eax
seg005:0048D056             neg eax
seg005:0048D058             dec eax
seg005:0048D059             bswap eax
seg005:0048D05B             xor ebx, eax    ; 对ebx操作
seg005:0048D05D             add ebp, eax
seg005:0048D05F             push ebp
seg005:0048D060             lea esp, ; 这里本来是retn,这一段代码只对ebx做了操作
```
这个代码段更新了本轮ebx

```
seg005:0048D064             mov eax,    ; esi指向原始保存了所有寄存器的位置
seg005:0048D066             add esi, 4       ; esi指向下一个原始push的位置
seg005:0048D06C             movzx ecx, byte ptr
seg005:0048D06F             lea edi, ; edi+1
seg005:0048D075             xor cl, bl
seg005:0048D077             dec cl
seg005:0048D079             ror cl, 1
seg005:0048D07B             sub cl, 5Dh ; ']'
seg005:0048D07E             not cl
seg005:0048D080             xor bl, cl       ; 更新ebx
seg005:0048D082             mov , eax; 将原来保存的寄存器搬运到里,ecx是由ebx和解密出来
seg005:0048D085             mov ecx,    ; 从这里到结束,其作用是对ebx又进行了一系列操作
seg005:0048D087             add edi, 4       ; edi+4
seg005:0048D08D             xor ecx, ebx
seg005:0048D08F             ror ecx, 1
seg005:0048D091             lea ecx,
seg005:0048D097             neg ecx
seg005:0048D099             xor ecx, 46ED52DEh
seg005:0048D09F             xor ebx, ecx    ; 更新ebx
seg005:0048D0A1             add ebp, ecx
seg005:0048D0A3             push ebp
seg005:0048D0A4             lea esp, ; 相当于retn结束
```
这一段代码的作用是把原始push的寄存器保存到里,ecx的值取决于edi和上一个代码段里的ebx.然后**更新本轮的ebx.**
之后该代码段一直循环直到**esi的值等于未进虚拟机的esp的值(保存完所有原始寄存器)结束.**
```
seg005:0048D332             mov ecx,    ; esi等于未进入虚拟机的esp,说明原始寄存器已经全部被保存了
seg005:0048D334             lea edi, ; edi+4
seg005:0048D33A             xor ecx, ebx
seg005:0048D33C             sub ecx, 607554FFh
seg005:0048D342             not ecx
seg005:0048D344             neg ecx
seg005:0048D346             inc ecx          ; ecx=0x12345678,这个值是根据和上一轮的ebx解密出来
seg005:0048D347             xor ebx, ecx
seg005:0048D349             sub esi, 4
seg005:0048D34F             mov , ecx    ; 结束 ecx=0x12345678
```
这段代码解密出操作数0x12345678放到里,刚好覆盖了第一个push的值.
```
seg005:0048D3B3             movzx eax, byte ptr ; 根据的值去读取的值
seg005:0048D3B6             add edi, 1
seg005:0048D3BC             xor al, bl
seg005:0048D3BE             inc al
seg005:0048D3C0             not al
seg005:0048D3C2             add al, 14h
seg005:0048D3C4             xor al, 4Eh
seg005:0048D3C6             xor bl, al
seg005:0048D3C8             mov ecx, ; 从读取寄存器
seg005:0048D3CB             sub esi, 4       ; esi减去4
seg005:0048D3D1             mov , ecx    ; 放到esi中,其实是把保存到原始栈中
seg005:0048D3D3             mov eax,
seg005:0048D3D5             add edi, 4
seg005:0048D3DB             xor eax, ebx
seg005:0048D3DD             add eax, 7DC64D28h
seg005:0048D3E2             neg eax
seg005:0048D3E4             bswap eax
seg005:0048D3E6             not eax
seg005:0048D3E8             xor ebx, eax    ; 更新ebx
seg005:0048D3EA             add ebp, eax
seg005:0048D3EC             push ebp
seg005:0048D3ED             lea esp, ; retn
```
这个代码段将之前存储到的值全部搬运到原始栈上.为虚拟机退出做准备.
```
seg005:0048D5A0             mov esp, esi    ; 最后将esi给esp
seg005:0048D5A2             pop ebx
seg005:0048D5A3             pop ecx
seg005:0048D5A4             pop ebp
seg005:0048D5A5             pop esi
seg005:0048D5A6             pop edi
seg005:0048D5A7             popf
seg005:0048D5A8             pop edx
seg005:0048D5A9             pop eax          ; 退出虚拟机
seg005:0048D5AA             retn
```
退出虚拟机.
## 结论
- 进入虚拟机时push的值最终会被解密出指向一片内存区域,并根据该值将原始寄存器保存到不同的位置和更新ebx值.
- 操作数的解密需要依赖上一轮的ebx值.
- 操作数的解密的过程在完成了所有寄存器的保存后执行.
- 虚拟机退出前会把的值保存到里,最后通过pop返回给寄存器

相关示例代码见
https://github.com/PShocker/vmp3_test

Domado 发表于 2021-8-19 13:31

看见vmp，直接拖入垃圾桶，哈哈

nug 发表于 2021-8-19 21:34

萌新菜鸟，内卷好严重啊～

asdime 发表于 2021-8-20 13:35

感谢分享，学习学习

ImpOuO 发表于 2022-6-15 03:42

学习学习{:1_893:}

iaoedsz2018 发表于 2022-11-16 16:11

萌新都这么顶了？

lixianga 发表于 2023-3-14 18:46

vmp打补丁会被检测到

cnbwl521 发表于 2023-3-14 19:08

看一半看不懂了。哎，继续学习吧。

页: [1]

吾爱破解 - 52pojie.cn's Archiver

萌新对VMP的分析