逆向基础
本帖最后由 鱼无论次 于 2017-4-13 17:39 编辑如果有错误请各位指正
参考书籍:
C++反汇编与逆向分析技术揭秘
汇编教学 by charme
老码识途
主要内容(不分先后顺序):
1.寻址Main函数入口点(为什么找3个push 1个call)
2.指令地址是如何计算出来的
3.所谓的程序入口地址Main函数
4.调用约定
5.善变的汇编指令
使用工具:
OD
VS2013 Debug版
直接上代码:
非常经典的一个程序Hello World,麻雀虽小五脏俱全
void Hello(){
printf("HelloWorld\n");
}
int _tmain(int argc,_TCHAR* argv[]){
printf("恭喜你找到了Main函数入口地址\n");
Hello();
return0;
}
1.寻址Main函数入口点
找到Main函数入口点就要知道Main函数的入口特征,我们可以通过VS2013调试。F10走出Main函数
我们发现Main函数其实也是一个函数,并非程序一开始就调用Main(IDA可以看的更直观)
main函数定义有三个参数
main(intargc,char *argv[],char *envp[])
1.argc:命令行参数个数,整数
2.argv:命令行信息,保存字符串数组首地址的指针变量,是一个指向数组的指针。
3.envp:环境变量的信息,和argv类型相同
参数argv与envp就是两个指针数组,当数组作为参数时,实际上以指针方式进行数据传递,这两个参数可以转换为char**二级指针类型。
默认情况下argv第0项是保存路径字符串的首地址
1.1:OD打开EXE程序
F7跟进遇到了两个call,先去看看第一个call有没有我们要找的特征(3个push1个call)
很遗憾并不在第一个call
F7跟进第二个call找找看(找3个push 1个call的函数)
小知识(所谓程序入口地址Main函数):
我们还可以发现程序并非从Main函数开始运行的,main函数也是一个参数,也需要被人调用。main函数只是我们语法规定的用户入口,而不是应用程序入口。
F7跟进历尽千辛万苦终于找到了
2:解析汇编代码
我们用VS2013来调试比较方便
补充知识:
补码表示:既其正整数值求反加1。比如,-1就是1求反,它只有最后一位是0,其他位均为1,再加上1,那么所有位均为1,即0xFFFFFFFF。对有符号数,最高bit为1,则说明它是一个负数如果对一个补码形式的负数求正整值,就是求反加1。比如,对-1求其整数值,就是对0xFFFFFFFF求反,即0。再加1,就是1。
指令地址是如何计算出来的:
E8是call的机器码,占一个字节,后面4个字节是call的地址,小端在内存中存放的是倒序的所以是FFFFFD8B。其实计算机寻址方式分为两种,一种是call 123432(绝对值),另外一种是相对定位就是用偏移量。偏移量是区分正与负(往前往后跳)。
FF FF FD 8B最高位是1,所以是负数。将其取反+1后,结果是275,再用call当前的地址00381455-275=3811E0+5(call字节数)=3811E5H
2.1:一些基础知识
基础汇编知识:
eax一般是当作函数的返回值
push esp-4
popesp+4
Call指令= push 下一条指令(程序从上往下走,jmp到一个地方执行完代码你要记得你回去的路吧)
jmp标号处
Ret指令= pop IP
栈的理解:
可以把栈理解成一个箱子,先放进去的东西最后才能拿出来(遵循先进后出的原则)
图片:
第一个先拿出来的是英语书
第二本拿出来的是数学书
最先进去的语文书,是最后拿出来的
2.2:函数汇编方式展示出来的样子
我们必须要了解的是,调用call函数进去的时候它原来是什么样子,执行完call你要给它还原回去,所以每次进去函数就会看见push xxx,因为函数内部要用到
汇编代码详解:
003813C0push ebp //保存ebp,ebp就相当于esp的备份003813C1
003813C1mov ebp,esp //esp后面要进行操作,所以要让ebp先帮它保存原来的值。这样esp怎么改变都不怕影响到后面的操作
003813C3 sub esp,0C0h //开辟空间
003813C9push ebx //保存寄存器,因为后面要用到
003813CApush esi
003813CBpush edi
/*************主要功能把分配的空间全部填CC****************/
003813CClea edi,
003813D2mov ecx,30h
003813D7mov eax,0CCCCCCCCh
003813DCrep stos dword ptr es:
详解:
stos是串存储指令,它的功能是将eax中的数据放入edi所指的地址中,同时edi增加4个字节。rep使指令重复指令ecx中填写的次数。方括号表示存储器,这个地址实际上是edi的内容所指向地址。这里的stos其实对应的是stosd,其他还有stosb,stosw,对应的处理的是4,1,2字节,这里对堆栈中30h*4个字节初始化为0CC也就是int3指令,这样发生意外时执行堆栈里面的内容会引发调试中断
/*************主要功能把分配的空间全部填CC****************/
printf("Hello World\n");
003813DE mov esi,esp
003813E0 push 385858h
003813E5 call dword ptr ds:
003813EBadd esp,4 //堆栈平衡后面会详解(调用约定)
003813EEcmp esi,esp //VS自带的堆栈平衡检查
003813F0call __RTC_CheckEsp (0381140h) //检查可以直接无视
003813F5pop edi //恢复寄存器 ,遵循先进后出的原则
003813F6 pop esi
003813F7 pop ebx
003813F8add esp,0C0h //用完了记得还原分配的栈空间
003813FE cmp ebp,esp //无视
00381400call __RTC_CheckEsp (0381140h) //VS自带的检查
00381405mov esp,ebp //ebp还给esp
00381407pop ebp //恢复ebp
00381408ret //ret返回
总结:
其实很多汇编代码都是系统帮我们生成的,或则是VS自带的检查代码。不要看到汇编代码多就恐惧,很多代码都是套路。
3.调用约定
常用的调用约定分为四种:
_stdcall(windowsAPI默认调用方式):参数压栈方式右到左,函数内平衡,函数结束ret xxx
_cdecl(c/c++默认调用方式):参数压栈方式右到左,函数外平衡堆栈,call后面跟着add esp,xxx
_fastcall:参数压栈方式右到左,寄存器方式传参,函数内平衡堆栈
_thiscall:参数压栈方式右到左,ecx传递this指针,函数内平衡堆栈
渣渣代码:
/*
简要说明:
this指针应属于指针类型,在32位环境下占4个字节大小,保存的数据为地址信息,"this"可翻译为"这个",因此经过字面的分析可以认为
this指针保存了所属对象的首地址。
*/
#include "stdafx.h"
class TestClass
{
public:
TestClass(int Number)
{
m_nNumber = Number;
}
int m_nNumber;
};
void _fastcall Show_fastcall(int nNumA, int nNumB)
{
printf("_fastcall调用方式%d %d \n", nNumA, nNumB);
}
void _cdeclShow_cdecl(int nNumA, int nNumB)
{
printf("_cdecl调用方式%d %d\n", nNumA, nNumB);
}
void _stdcall Show_stdcall(int nNumA, int nNumB)
{
printf("_stdcall调用方式%d %d\n", nNumA, nNumB);
}
int _tmain(int argc, _TCHAR* argv[])
{
Show_stdcall(7, 8);
Show_cdecl(10, 11);
Show_fastcall(22, 33);
TestClass Test(argc);
return 0;
}
_stdcall:参数压栈方式右到左,函数内平衡,函数结束ret xxx
Show_stdcall(7, 8);
00B137A8push 8 //压栈方式右到左
00B137AApush 7
00B137ACcall Show_stdcall (0B1106Eh)
00B11580 ret 8 //函数内结束的时候ret 8平衡堆栈
_cdecl(c/c++默认调用方式):参数压栈方式右到左,函数外平衡堆栈,call后面跟着add esp,xxx
Show_cdecl(10, 11);
00B137B1push 0Bh
00B137B3push 0Ah
00B137B5call Show_cdecl (0B111D1h)
00B137BAadd esp,8 //函数外平衡堆栈
_fastcall:参数压栈方式右到左,寄存器方式传参,函数内平衡堆栈
好处是:传递效率高,因为是使用寄存器所以函数结束不用清空栈
坏处是:就只能用两个寄存器ecx,edx大于2就只能乖乖的用栈传递参数
Show_fastcall(22, 33);
00BF1553mov edx,21h
00BF1558mov ecx,16h
00BF155Dcall Show_fastcall (0BF1154h)
return 0;
00BF1562xor eax,eax
例如这个例子:
_fastcall而寄存器比较少,它只使用了ecx,edx保存第一个和第二个参数,其余的放在堆栈操作
Show_fastcall(22, 33,44);
012D1553push 2Ch //大于2个参数只能用栈
012D1555mov edx,21h
012D155Amov ecx,16h
012D155Fcall Show_fastcall (012D11EAh)
call函数内部:
012D1499mov esp,ebp
012D149Bpop ebp
012D149Cret 4 //函数内平衡堆栈
_thiscall:参数压栈方式右到左,ecx传递this指针,函数内平衡堆栈
4.善变的汇编语言(如果没兴趣可以直接无视)
我记得有一天上课薛老师给我们发了一套某公司的面试题目是:栈的分配内存方式除了sub esp,xxx还有哪些?其实无非就是考你思维灵不灵活。并非只有1+1=2,条条大路通罗马。
分配栈内存主要是对esp做减法。
push xxx
pushad
add esp,负数
dec esp
例如call的调用
正常的call调用:
push 0
push 0
push offset szText
push 0
call MessageBox
非正常call调用:
push 0
push 0
push offset szText
push 0
push offset aa //返回地址
push offset MessageBox //调用函数
lea esp, //+4等于返回地址
jmp dword ptr //jmp DWORD ptr 并不改变ESP的值等于调用函数MessageBox,但是esp值并没有改变还是指向返回地址
aa:
xor eax,eax //垃圾代码,只是为了测试
致谢
感谢15PB老师们的辛勤栽培! 感谢分享经验。论坛因你而精彩!
感谢分享经验。论坛因你而精彩! 看不懂大佬{:301_981:} 小白进来学习了 谢谢分享基础教程谢谢! 可以当入门笔记记下来 厉害厉害, 已复制为doc,慢慢学习,谢谢分享经验! 大量的文字 感谢分享,留名备用