鱼无论次 发表于 2017-4-13 09:26

逆向基础

本帖最后由 鱼无论次 于 2017-4-13 17:39 编辑

如果有错误请各位指正

参考书籍:
C++反汇编与逆向分析技术揭秘
汇编教学 by charme
老码识途

主要内容(不分先后顺序):
1.寻址Main函数入口点(为什么找3个push 1个call)
2.指令地址是如何计算出来的
3.所谓的程序入口地址Main函数
4.调用约定
5.善变的汇编指令

使用工具:
OD
VS2013 Debug版

直接上代码:
非常经典的一个程序Hello World,麻雀虽小五脏俱全
void Hello(){
   printf("HelloWorld\n");
}
int _tmain(int argc,_TCHAR* argv[]){
   printf("恭喜你找到了Main函数入口地址\n");
       Hello();
   return0;
}
1.寻址Main函数入口点
找到Main函数入口点就要知道Main函数的入口特征,我们可以通过VS2013调试。F10走出Main函数

我们发现Main函数其实也是一个函数,并非程序一开始就调用Main(IDA可以看的更直观)

main函数定义有三个参数
main(intargc,char *argv[],char *envp[])
1.argc:命令行参数个数,整数
2.argv:命令行信息,保存字符串数组首地址的指针变量,是一个指向数组的指针。
3.envp:环境变量的信息,和argv类型相同
参数argv与envp就是两个指针数组,当数组作为参数时,实际上以指针方式进行数据传递,这两个参数可以转换为char**二级指针类型。
默认情况下argv第0项是保存路径字符串的首地址

1.1:OD打开EXE程序

F7跟进遇到了两个call,先去看看第一个call有没有我们要找的特征(3个push1个call)

很遗憾并不在第一个call

F7跟进第二个call找找看(找3个push 1个call的函数)

小知识(所谓程序入口地址Main函数):
      我们还可以发现程序并非从Main函数开始运行的,main函数也是一个参数,也需要被人调用。main函数只是我们语法规定的用户入口,而不是应用程序入口。

F7跟进历尽千辛万苦终于找到了


2:解析汇编代码
   我们用VS2013来调试比较方便

补充知识:
补码表示:既其正整数值求反加1。比如,-1就是1求反,它只有最后一位是0,其他位均为1,再加上1,那么所有位均为1,即0xFFFFFFFF。对有符号数,最高bit为1,则说明它是一个负数如果对一个补码形式的负数求正整值,就是求反加1。比如,对-1求其整数值,就是对0xFFFFFFFF求反,即0。再加1,就是1。

指令地址是如何计算出来的:
    E8是call的机器码,占一个字节,后面4个字节是call的地址,小端在内存中存放的是倒序的所以是FFFFFD8B。其实计算机寻址方式分为两种,一种是call 123432(绝对值),另外一种是相对定位就是用偏移量。偏移量是区分正与负(往前往后跳)。
    FF FF FD 8B最高位是1,所以是负数。将其取反+1后,结果是275,再用call当前的地址00381455-275=3811E0+5(call字节数)=3811E5H

2.1:一些基础知识
基础汇编知识:
    eax一般是当作函数的返回值
    push esp-4
    popesp+4
    Call指令= push 下一条指令(程序从上往下走,jmp到一个地方执行完代码你要记得你回去的路吧)
                   jmp标号处
    Ret指令= pop IP
栈的理解:   
    可以把栈理解成一个箱子,先放进去的东西最后才能拿出来(遵循先进后出的原则)
图片:
第一个先拿出来的是英语书   

第二本拿出来的是数学书

最先进去的语文书,是最后拿出来的


2.2:函数汇编方式展示出来的样子
    我们必须要了解的是,调用call函数进去的时候它原来是什么样子,执行完call你要给它还原回去,所以每次进去函数就会看见push xxx,因为函数内部要用到

汇编代码详解:
003813C0push      ebp                                                         //保存ebp,ebp就相当于esp的备份003813C1
003813C1mov         ebp,esp                                                //esp后面要进行操作,所以要让ebp先帮它保存原来的值。这样esp怎么改变都不怕影响到后面的操作
003813C3   sub       esp,0C0h                                             //开辟空间
003813C9push      ebx                                                      //保存寄存器,因为后面要用到
003813CApush    esi            
003813CBpush    edi      
/*************主要功能把分配的空间全部填CC****************/
003813CClea      edi,   
003813D2mov    ecx,30h
003813D7mov    eax,0CCCCCCCCh
003813DCrep stos    dword ptr es:
详解:
    stos是串存储指令,它的功能是将eax中的数据放入edi所指的地址中,同时edi增加4个字节。rep使指令重复指令ecx中填写的次数。方括号表示存储器,这个地址实际上是edi的内容所指向地址。这里的stos其实对应的是stosd,其他还有stosb,stosw,对应的处理的是4,1,2字节,这里对堆栈中30h*4个字节初始化为0CC也就是int3指令,这样发生意外时执行堆栈里面的内容会引发调试中断   
/*************主要功能把分配的空间全部填CC****************/
             printf("Hello World\n");
003813DE mov   esi,esp
003813E0 push   385858h
003813E5 call       dword ptr ds:
003813EBadd          esp,4                                                //堆栈平衡后面会详解(调用约定)
003813EEcmp          esi,esp                                          //VS自带的堆栈平衡检查
003813F0call         __RTC_CheckEsp (0381140h)       //检查可以直接无视
003813F5pop         edi                                                   //恢复寄存器 ,遵循先进后出的原则                        
003813F6 pop       esi
003813F7 pop       ebx
003813F8add         esp,0C0h                                       //用完了记得还原分配的栈空间
003813FE cmp         ebp,esp                                           //无视
00381400call         __RTC_CheckEsp (0381140h)        //VS自带的检查
00381405mov         esp,ebp                                       //ebp还给esp
00381407pop          ebp                                                 //恢复ebp
00381408ret                                                                  //ret返回
总结:      
      其实很多汇编代码都是系统帮我们生成的,或则是VS自带的检查代码。不要看到汇编代码多就恐惧,很多代码都是套路。

3.调用约定
常用的调用约定分为四种:
_stdcall(windowsAPI默认调用方式):参数压栈方式右到左,函数内平衡,函数结束ret xxx
_cdecl(c/c++默认调用方式):参数压栈方式右到左,函数外平衡堆栈,call后面跟着add esp,xxx
_fastcall:参数压栈方式右到左,寄存器方式传参,函数内平衡堆栈
_thiscall:参数压栈方式右到左,ecx传递this指针,函数内平衡堆栈

渣渣代码:
/*
简要说明:
    this指针应属于指针类型,在32位环境下占4个字节大小,保存的数据为地址信息,"this"可翻译为"这个",因此经过字面的分析可以认为
this指针保存了所属对象的首地址。
*/
#include "stdafx.h"
class TestClass
{
public:
    TestClass(int Number)
    {
      m_nNumber = Number;
    }
    int m_nNumber;
};
void _fastcall Show_fastcall(int nNumA, int nNumB)
{
    printf("_fastcall调用方式%d %d \n", nNumA, nNumB);
}
void _cdeclShow_cdecl(int nNumA, int nNumB)
{
    printf("_cdecl调用方式%d %d\n", nNumA, nNumB);
}
void _stdcall Show_stdcall(int nNumA, int nNumB)
{
    printf("_stdcall调用方式%d %d\n", nNumA, nNumB);
}
int _tmain(int argc, _TCHAR* argv[])
{
    Show_stdcall(7, 8);
    Show_cdecl(10, 11);
    Show_fastcall(22, 33);
    TestClass Test(argc);
    return 0;
}


_stdcall:参数压栈方式右到左,函数内平衡,函数结束ret xxx
Show_stdcall(7, 8);
00B137A8push      8                                                         //压栈方式右到左
00B137AApush      7
00B137ACcall      Show_stdcall (0B1106Eh)
00B11580   ret      8                                                         //函数内结束的时候ret 8平衡堆栈


_cdecl(c/c++默认调用方式):参数压栈方式右到左,函数外平衡堆栈,call后面跟着add esp,xxx
Show_cdecl(10, 11);
00B137B1push      0Bh
00B137B3push      0Ah
00B137B5call          Show_cdecl (0B111D1h)
00B137BAadd         esp,8                                                //函数外平衡堆栈

_fastcall:参数压栈方式右到左,寄存器方式传参,函数内平衡堆栈
好处是:传递效率高,因为是使用寄存器所以函数结束不用清空栈
坏处是:就只能用两个寄存器ecx,edx大于2就只能乖乖的用栈传递参数
Show_fastcall(22, 33);
00BF1553mov         edx,21h
00BF1558mov         ecx,16h
00BF155Dcall      Show_fastcall (0BF1154h)
         return 0;
00BF1562xor         eax,eax

例如这个例子:
_fastcall而寄存器比较少,它只使用了ecx,edx保存第一个和第二个参数,其余的放在堆栈操作
Show_fastcall(22, 33,44);
012D1553push      2Ch                        //大于2个参数只能用栈
012D1555mov         edx,21h
012D155Amov         ecx,16h
012D155Fcall          Show_fastcall (012D11EAh)
call函数内部:
012D1499mov      esp,ebp
012D149Bpop         ebp
012D149Cret         4                        //函数内平衡堆栈

_thiscall:参数压栈方式右到左,ecx传递this指针,函数内平衡堆栈



4.善变的汇编语言(如果没兴趣可以直接无视)
    我记得有一天上课薛老师给我们发了一套某公司的面试题目是:栈的分配内存方式除了sub esp,xxx还有哪些?其实无非就是考你思维灵不灵活。并非只有1+1=2,条条大路通罗马。
    分配栈内存主要是对esp做减法。
   push xxx
   pushad   
   add esp,负数   
   dec esp

例如call的调用
正常的call调用:
      push 0      
      push 0      
      push offset szText      
      push 0      
      call MessageBox
非正常call调用:
      push 0      
      push 0      
      push offset szText      
      push 0      
      push offset aa                        //返回地址      
      push offset MessageBox          //调用函数      
      lea esp,                      //+4等于返回地址      
      jmp dword ptr          //jmp DWORD ptr 并不改变ESP的值等于调用函数MessageBox,但是esp值并没有改变还是指向返回地址
aa:      
      xor eax,eax                           //垃圾代码,只是为了测试
致谢
感谢15PB老师们的辛勤栽培!

czwuyang 发表于 2017-4-13 11:15

感谢分享经验。论坛因你而精彩!

fantome 发表于 2017-4-13 11:39


感谢分享经验。论坛因你而精彩!

喵呜、 发表于 2017-4-13 13:12

看不懂大佬{:301_981:}

jusdy_xiao7 发表于 2017-4-13 13:25

小白进来学习了 谢谢分享基础教程谢谢!

SN1t2lO 发表于 2017-4-13 13:41

可以当入门笔记记下来

ganxie 发表于 2017-4-13 13:47

厉害厉害,

z94213715 发表于 2017-4-13 15:06

已复制为doc,慢慢学习,谢谢分享经验!

爆破 发表于 2017-4-13 15:49

大量的文字

lthink 发表于 2017-4-13 15:49

感谢分享,留名备用
页: [1] 2 3 4 5 6
查看完整版本: 逆向基础