前言及汇编(30小时精通C++和外挂实战)

avatar
作者
猴君
阅读量:0

前言及汇编(30小时精通C++和外挂实战)

1,前言

对C++疑惑
C++学习意义何在?
什么地方能用到C++

主要内容
C++(只学习核心语法,面向有基础的人)
语法
通过反汇编窥探底层

Windows编程
windows API、 MFC

项目实战(X86汇编、植物大战僵尸外挂)

If-else和switch那个效率高(直接看汇编代码)

引用的本质是什么?

多态\需函数的实现原理是什么?
函数(方法)的函数、局部变量在内存中是如何布局的?

看一下植物大战僵尸的外挂功能

1,打开外挂程序,程序监控是否打开游戏,若无,当中内容无法点击
2,打开植物大战僵尸中文版的程序,外挂中的内容就可以点击了
3,豌豆10下才能打死僵尸,无CD(冷却时间),后台运行(游戏和外挂一同运行)
4,无限阳光、植物不死、无限金币、秒杀僵尸、后台运行、无CD、僵尸不死
5,游戏一关闭,外挂就不能点击

读取植物大战僵尸的进程,读取内存、写入内存(这样达到外挂的效果)

WindowsAPI windows提供的一些API一些函数,外挂肯定要访问植物大战僵尸中的内存数据,如何访问,跨进程访问(用到WindowsAPI),MFC用来做界面的

2,汇编的重要性

利用汇编挖掘汇编语言的本质

接触的第一门语言?

用过哪些编程语言?

是否有思考过代码背后的原理?

是否接触过汇编语言?

学习编程语言、技术的方式?

(1)网上流传的谬论

不要完全相信任何非一手的技术资料,尤其是中文资料!!!(C++如果没有构造一个函数,编译器会默认构造一个函数这个是错的)

www3.org
我们要看官方文档

有些翻译的书本上也有错误。

官方的一定是对的,以后学任何东西都学官方,官方有时也会出错

我们要掌握一种能力,一种方法论可以验证这个东西是错的,不能盲目相信别人
看东西优先看官方的,但是英文,可以谷歌右击翻译

(2)国内技术氛围

  • 大部分程序非科班出身(非计算机专业,缺少一些基础如编译原理、操作系统、数据结构算法),只会写编程语言如java、python会怎么写不会报错,定义变量类这只是编程语言表面,使用的语法,永远只会这个编程语言,没出新的语言都要学,这些都是有共性的,掌握根本这些语言就是0和1

  • 抄袭严重

  • 过于势力,不是很纯粹(很多人也会写书只是为了赚钱,而且还有错误)

  • 期望
    发自内心的热爱技术
    提高自己要求

(3)学习建议

  • 首选官方资料(手册、官网、文档)
  • 英文资料-》中文资料
  • 掌握验证知识点正确性的方法
    如果是编程语言相关的知识点,掌握汇编语言是最靠谱的验证只是点正确性的方式
  • 学好汇编语言的用处
    1,掌握编程语言、代码的本质,不再依赖其他一些误人子弟的资料
    2,破解
    3,外挂

(4)代码本质挖掘(会使用汇编挖掘下面演示)

Sizeof的本质(sizeof(int)此不是函数而是编译器特性,编译器一看到就将其翻译成4 )
a++ 和 ++a的区别
If-else和switch,谁的效率高(转成汇编,看有多少个汇编指令,或汇编怎么调用内存)
程序的内存布局
多态的实现原理

我们通过汇编就能知道a++=20,++a=20

打开VS文件-新建-VC+±空项目-名为testASM
接着右键源文件–添加新建项–名为main.cpp

#include <iostream> using namespace std;  void test(int a){  }  int main(){ 	test(20); 	cout << sizeof(int) << endl; 	getchar(); 	return 0; } 

在某处打上断点,运行后进入一个界面,右击转入反汇编

	test(20); 00CB3B8E  push        14h   00CB3B90  call        test (0CB1442h)  //此处有call为调用函数 00CB3B95  add         esp,4    cout << sizeof(int) << endl; 00CB3B98  mov         esi,esp   00CB3B9A  push        0CB1398h   00CB3B9F  mov         edi,esp   00CB3BA1  push        4  				//而此处是push进去的,没有调用sizeof这个函数 00CB3BA3  mov         ecx,dword ptr ds:[0CC0090h]   00CB3BA9  call        dword ptr ds:[0CC009Ch]   00CB3BAF  cmp         edi,esp   00CB3BB1  call        __RTC_CheckEsp (0CB12E9h)   00CB3BB6  mov         ecx,eax   00CB3BB8  call        dword ptr ds:[0CC00A0h]   00CB3BBE  cmp         esi,esp   00CB3BC0  call        __RTC_CheckEsp (0CB12E9h)  

然后将sizeof(int) 改为4再此运行发现汇编如下

	cout << 4 << endl; 00103B98  mov         esi,esp   00103B9A  push        101398h   00103B9F  mov         edi,esp   00103BA1  push        4   00103BA3  mov         ecx,dword ptr ds:[110090h]   00103BA9  call        dword ptr ds:[1100CCh]   00103BAF  cmp         edi,esp   00103BB1  call        __RTC_CheckEsp (01012E9h)   00103BB6  mov         ecx,eax   00103BB8  call        dword ptr ds:[1100A0h]   00103BBE  cmp         esi,esp   00103BC0  call        __RTC_CheckEsp (01012E9h)   

发现更改前后的汇编代码一样,说明sizeof(int)不是函数,是一个编译器特性,编译器一旦认识到这个家伙直接把代码改成4

3,程序的本质

(1)软件\程序的执行过程

在这里插入图片描述

无论什么程序都会开发成软件运行,或者服务器程序运行在服务器上。
我们开发的程序代码(如QQ)放在硬盘(手机、电脑磁盘)上,但是程序要运行就需要装载到内存中,开发的程序软件包含大量CPU指令,平时写的代码最终都转换成了CPU能识别的指令,软件里面的代码是靠CPU执行的,但int等电脑无法识别,转换为机器代码又名CPU指令(01),生成的可执行软件就是转换好的01了,这个由编译器将我们写的代码转换为机器码,如植物大战僵尸的exe程序就全部由01组成。

(2)CPU如何执行?

CPU读取内存中的代码,双击软件会装载到内存中,所以所有CPU指令就都在内存了,CPU读取到内存中的CPU指令后就会控制计算机中的一些设备如显示器、音响、话筒等。 CPU包含寄存器()、运算器(加减、地址、寻址)、控制器
内存和寄存器都能存放东西,但CPU访问寄存器(在CPU里面)是快的,int a=3;int b=a+1;变量a与b的存储空间在内存中,做加法运算时并不是直接对内存加法,将内存数据拿到寄存器,再将寄存器中的东西+1,加完的结果再送回到内存。寄存器访问速度较快,很多时候是对寄存器访问运算不是内存。
在这里插入图片描述

4,程序语言的发展

(1)机器语言

由0和1组成

(2)汇编语言

用符号代替了0和1,比机器语言便于阅读和记忆

(3)高级语言

C\C++\JAVA\JAVASCRIPT\PYTHON等,更接近人类自然语言

操作:将寄存器BX的内容送入寄存器AX
机器语言:1000100111011000
汇编语言:mov ax,bx
高级语言:ax = bx;
真正开发过程中,高级语言是不会访问寄存器的这里只是做一个类比

编译器包含前端后端不同于网页
在这里插入图片描述

几个不同的代码产生的汇编语言完全一样,故汇编\机器语言几乎不能还原成高级语言

但有的工具可以还原成大概的C++代码即伪代码(并不一定是正确的代码)

5,一些编程语言的本质区别

(1)输出helloworld

新建C++空项目helloworld
源文件右击添加新建项main.cpp

#include <iostream> using namespace std;  int main(){ 	cout << "hello world!" << endl;	//打印helloworld  	getchar(); 	return 0; } 

下面使用java(my eclipse)来写一个程序

System.out.println(“hello world!”); 

写一个PHP输出helloworld

<?php  echo “hello world!”?> 

使用js输出一个helloworld

alert(“hello world!”); 

我们通过不同的编程语言写了helloWord这个程序,这些语言都是大同小异,都有打印的函数,

(2)C++语言

能轻易反汇编(马上就能知道代码对应本质即汇编代码是什么)

(3)JavaScript

脚本语言,简称js
由浏览器进行解析,(浏览器打开js代码就会解析)

(4)PHP

脚本语言
由zend engine (ZE)引擎进行解析(和浏览器一样)

(5)Java

由JVM进行装载字节码

(6)汇编代码与机器码等价

无论什么编程语言写的东西最终都会跑到计算机上,最后都会转换成机器码
Js.php写的代码对应的机器码什么样子是几乎看不到的,拿不到汇编代码,引擎屏蔽了细节不让看到,它引擎只是让我们知道alert能弹窗,最后转成的代码不告诉你。

Java也有编译器,但编译成的是class字节码,JVM装载字节码class,最终在机器上运行的还是机器码

在这里插入图片描述

(7)三大语言共三种情况

编译型的语言(不依赖虚拟机,直接转成机器码跑在电脑上)
C\C++\OC\SWIFT

脚本语言
Python、js、PHP

编译型的语言(依赖虚拟机(可以认为小型操作系统),由虚拟机转换一下,最终机器码我们不知道)
Java、ruby

机器码只有0和1,而开发工具中的16进制是为了方便看转换成的

我们可以通过C++来掌握编程语言的本质,C++太容易反汇编

每出一门编程语言都是为了一个特定的场景产生的,如HTML、css就是为了做网页,用以前的语言可以干但是太痛苦,还得写解析器解析C++,但是HTML就不同了,直接浏览器就能识别,HTML更适合做网页。

编译型的语言这要写错一个就不能运行,但是脚本语言(是一行行扫描的,正确执行,不正确不执行到最后),编译型全对,脚本前面正确的可执行。
脚本语言效率是比编译型的低,因为是一行行的扫描的

(8)CPU不同,汇编也是不一样的

我们有X86架构,有arm架构,写同样代码,int a=10;生成的X86代码与arm架构生成的汇编代码可能就不太一样。

汇编代码代码转换成机器码,可以认为两者等价,CPU支持哪些机器指令,支持哪些汇编代码是由CPU的架构来决定的,CPU不太意味着其识别的汇编代码、机器码是有所不同。

编译成不同架构的代码,汇编程序是不一样的,如C++编译成X86或arm

不同编程语言干的事情是一样的,而且是同一种架构,格式也是一样的,汇编的格式和架构有关,CPU架构不是系统架构是CPU

广告一刻

为您即时展示最新活动产品广告消息,让您随时掌握产品活动新动态!