前言及汇编(30小时精通C++和外挂实战)
1,前言
对C++疑惑
C++学习意义何在?
什么地方能用到C++
主要内容
C++(只学习核心语法,面向有基础的人)
语法
通过反汇编窥探底层
Windows编程
windows API、 MFC
项目实战(X86汇编、植物大战僵尸外挂)
If-else和switch那个效率高(直接看汇编代码)
引用的本质是什么?
多态\需函数的实现原理是什么?
函数(方法)的函数、局部变量在内存中是如何布局的?
看一下植物大战僵尸的外挂功能
1,打开外挂程序,程序监控是否打开游戏,若无,当中内容无法点击
2,打开植物大战僵尸中文版的程序,外挂中的内容就可以点击了
3,豌豆10下才能打死僵尸,无CD(冷却时间),后台运行(游戏和外挂一同运行)
4,无限阳光、植物不死、无限金币、秒杀僵尸、后台运行、无CD、僵尸不死
5,游戏一关闭,外挂就不能点击
读取植物大战僵尸的进程,读取内存、写入内存(这样达到外挂的效果)
WindowsAPI windows提供的一些API一些函数,外挂肯定要访问植物大战僵尸中的内存数据,如何访问,跨进程访问(用到WindowsAPI),MFC用来做界面的
2,汇编的重要性
利用汇编挖掘汇编语言的本质
接触的第一门语言?
用过哪些编程语言?
是否有思考过代码背后的原理?
是否接触过汇编语言?
学习编程语言、技术的方式?
(1)网上流传的谬论
不要完全相信任何非一手的技术资料,尤其是中文资料!!!(C++如果没有构造一个函数,编译器会默认构造一个函数这个是错的)
www3.org
我们要看官方文档
有些翻译的书本上也有错误。
官方的一定是对的,以后学任何东西都学官方,官方有时也会出错
我们要掌握一种能力,一种方法论可以验证这个东西是错的,不能盲目相信别人
看东西优先看官方的,但是英文,可以谷歌右击翻译
(2)国内技术氛围
大部分程序非科班出身(非计算机专业,缺少一些基础如编译原理、操作系统、数据结构算法),只会写编程语言如java、python会怎么写不会报错,定义变量类这只是编程语言表面,使用的语法,永远只会这个编程语言,没出新的语言都要学,这些都是有共性的,掌握根本这些语言就是0和1
抄袭严重
过于势力,不是很纯粹(很多人也会写书只是为了赚钱,而且还有错误)
期望
发自内心的热爱技术
提高自己要求
(3)学习建议
- 首选官方资料(手册、官网、文档)
- 英文资料-》中文资料
- 掌握验证知识点正确性的方法
如果是编程语言相关的知识点,掌握汇编语言是最靠谱的验证只是点正确性的方式 - 学好汇编语言的用处
1,掌握编程语言、代码的本质,不再依赖其他一些误人子弟的资料
2,破解
3,外挂
(4)代码本质挖掘(会使用汇编挖掘下面演示)
Sizeof的本质(sizeof(int)此不是函数而是编译器特性,编译器一看到就将其翻译成4 )
a++ 和 ++a的区别
If-else和switch,谁的效率高(转成汇编,看有多少个汇编指令,或汇编怎么调用内存)
程序的内存布局
多态的实现原理
我们通过汇编就能知道a++=20,++a=20
打开VS文件-新建-VC+±空项目-名为testASM
接着右键源文件–添加新建项–名为main.cpp
#include <iostream> using namespace std; void test(int a){ } int main(){ test(20); cout << sizeof(int) << endl; getchar(); return 0; }
在某处打上断点,运行后进入一个界面,右击转入反汇编
test(20); 00CB3B8E push 14h 00CB3B90 call test (0CB1442h) //此处有call为调用函数 00CB3B95 add esp,4 cout << sizeof(int) << endl; 00CB3B98 mov esi,esp 00CB3B9A push 0CB1398h 00CB3B9F mov edi,esp 00CB3BA1 push 4 //而此处是push进去的,没有调用sizeof这个函数 00CB3BA3 mov ecx,dword ptr ds:[0CC0090h] 00CB3BA9 call dword ptr ds:[0CC009Ch] 00CB3BAF cmp edi,esp 00CB3BB1 call __RTC_CheckEsp (0CB12E9h) 00CB3BB6 mov ecx,eax 00CB3BB8 call dword ptr ds:[0CC00A0h] 00CB3BBE cmp esi,esp 00CB3BC0 call __RTC_CheckEsp (0CB12E9h)
然后将sizeof(int) 改为4再此运行发现汇编如下
cout << 4 << endl; 00103B98 mov esi,esp 00103B9A push 101398h 00103B9F mov edi,esp 00103BA1 push 4 00103BA3 mov ecx,dword ptr ds:[110090h] 00103BA9 call dword ptr ds:[1100CCh] 00103BAF cmp edi,esp 00103BB1 call __RTC_CheckEsp (01012E9h) 00103BB6 mov ecx,eax 00103BB8 call dword ptr ds:[1100A0h] 00103BBE cmp esi,esp 00103BC0 call __RTC_CheckEsp (01012E9h)
发现更改前后的汇编代码一样,说明sizeof(int)不是函数,是一个编译器特性,编译器一旦认识到这个家伙直接把代码改成4
3,程序的本质
(1)软件\程序的执行过程
无论什么程序都会开发成软件运行,或者服务器程序运行在服务器上。
我们开发的程序代码(如QQ)放在硬盘(手机、电脑磁盘)上,但是程序要运行就需要装载到内存中,开发的程序软件包含大量CPU指令,平时写的代码最终都转换成了CPU能识别的指令,软件里面的代码是靠CPU执行的,但int等电脑无法识别,转换为机器代码又名CPU指令(01),生成的可执行软件就是转换好的01了,这个由编译器将我们写的代码转换为机器码,如植物大战僵尸的exe程序就全部由01组成。
(2)CPU如何执行?
CPU读取内存中的代码,双击软件会装载到内存中,所以所有CPU指令就都在内存了,CPU读取到内存中的CPU指令后就会控制计算机中的一些设备如显示器、音响、话筒等。 CPU包含寄存器()、运算器(加减、地址、寻址)、控制器
内存和寄存器都能存放东西,但CPU访问寄存器(在CPU里面)是快的,int a=3;int b=a+1;变量a与b的存储空间在内存中,做加法运算时并不是直接对内存加法,将内存数据拿到寄存器,再将寄存器中的东西+1,加完的结果再送回到内存。寄存器访问速度较快,很多时候是对寄存器访问运算不是内存。
4,程序语言的发展
(1)机器语言
由0和1组成
(2)汇编语言
用符号代替了0和1,比机器语言便于阅读和记忆
(3)高级语言
C\C++\JAVA\JAVASCRIPT\PYTHON等,更接近人类自然语言
操作:将寄存器BX的内容送入寄存器AX
机器语言:1000100111011000
汇编语言:mov ax,bx
高级语言:ax = bx;
真正开发过程中,高级语言是不会访问寄存器的这里只是做一个类比
编译器包含前端后端不同于网页
几个不同的代码产生的汇编语言完全一样,故汇编\机器语言几乎不能还原成高级语言
但有的工具可以还原成大概的C++代码即伪代码(并不一定是正确的代码)
5,一些编程语言的本质区别
(1)输出helloworld
新建C++空项目helloworld
源文件右击添加新建项main.cpp
#include <iostream> using namespace std; int main(){ cout << "hello world!" << endl; //打印helloworld getchar(); return 0; }
下面使用java(my eclipse)来写一个程序
System.out.println(“hello world!”);
写一个PHP输出helloworld
<?php echo “hello world!”?>
使用js输出一个helloworld
alert(“hello world!”);
我们通过不同的编程语言写了helloWord这个程序,这些语言都是大同小异,都有打印的函数,
(2)C++语言
能轻易反汇编(马上就能知道代码对应本质即汇编代码是什么)
(3)JavaScript
脚本语言,简称js
由浏览器进行解析,(浏览器打开js代码就会解析)
(4)PHP
脚本语言
由zend engine (ZE)引擎进行解析(和浏览器一样)
(5)Java
由JVM进行装载字节码
(6)汇编代码与机器码等价
无论什么编程语言写的东西最终都会跑到计算机上,最后都会转换成机器码
Js.php写的代码对应的机器码什么样子是几乎看不到的,拿不到汇编代码,引擎屏蔽了细节不让看到,它引擎只是让我们知道alert能弹窗,最后转成的代码不告诉你。
Java也有编译器,但编译成的是class字节码,JVM装载字节码class,最终在机器上运行的还是机器码
(7)三大语言共三种情况
编译型的语言(不依赖虚拟机,直接转成机器码跑在电脑上)
C\C++\OC\SWIFT
脚本语言
Python、js、PHP
编译型的语言(依赖虚拟机(可以认为小型操作系统),由虚拟机转换一下,最终机器码我们不知道)
Java、ruby
机器码只有0和1,而开发工具中的16进制是为了方便看转换成的
我们可以通过C++来掌握编程语言的本质,C++太容易反汇编
每出一门编程语言都是为了一个特定的场景产生的,如HTML、css就是为了做网页,用以前的语言可以干但是太痛苦,还得写解析器解析C++,但是HTML就不同了,直接浏览器就能识别,HTML更适合做网页。
编译型的语言这要写错一个就不能运行,但是脚本语言(是一行行扫描的,正确执行,不正确不执行到最后),编译型全对,脚本前面正确的可执行。
脚本语言效率是比编译型的低,因为是一行行的扫描的
(8)CPU不同,汇编也是不一样的
我们有X86架构,有arm架构,写同样代码,int a=10;生成的X86代码与arm架构生成的汇编代码可能就不太一样。
汇编代码代码转换成机器码,可以认为两者等价,CPU支持哪些机器指令,支持哪些汇编代码是由CPU的架构来决定的,CPU不太意味着其识别的汇编代码、机器码是有所不同。
编译成不同架构的代码,汇编程序是不一样的,如C++编译成X86或arm
不同编程语言干的事情是一样的,而且是同一种架构,格式也是一样的,汇编的格式和架构有关,CPU架构不是系统架构是CPU