一、关于程序运行时内存与硬盘的关系介绍
如果你的电脑上安装了QQ , 你希望和好友聊天 , 会双击QQ图标,打开QQ软件,输入账号和密码,然后登录就可以了 。那么,QQ是怎么运行起来的呢?
首先,有一点你要明确,你安装的QQ软件是保存在硬盘中的 。
双击QQ图标,操作系统就会知道你要运行这个软件,它会在硬盘中找到你安装的QQ软件,将数据(安装的软件本质上就是很多数据的集合)复制到内存 。对!就是复制到内存!QQ不是在硬盘中运行的,而是在内存中运行的 。
为什么呢?因为内存的读写速度比硬盘快很多 。
对于读写速度,内存 > 固态硬盘 > 机械硬盘 。机械硬盘是靠电机带动盘片转动来读写数据的,而内存条通过电路来读写数据,电机的转速肯定没有电的传输速度(几乎是光速)快 。虽然固态硬盘也是通过电路来读写数据,但是因为与内存的控制方式不一样,速度也不及内存 。
所以,不管是运行QQ还是编辑Word文档,都是先将硬盘上的数据复制到内存,才能让CPU来处理 , 这个过程就叫作载入内存(Load into Memory) 。完成这个过程需要一个特殊的程序(软件),这个程序就叫做加载器(Loader) 。
CPU直接与内存打交道,它会读取内存中的数据进行处理,并将结果保存到内存 。如果需要保存到硬盘,才会将内存中的数据复制到硬盘 。
例如,打开Word文档,输入一些文字,虽然我们看到的不一样了,但是硬盘中的文档没有改变,新增的文字暂时保存到了内存,Ctrl+S才会保存到硬盘 。因为内存断电后会丢失数据 , 所以如果你编辑完Word文档忘记保存就关机了,那么你将永远无法找回这些内容 。
虚拟内存
如果我们运行的程序较多,占用的空间就会超过内存(内存条)容量 。例如计算机的内存容量为2G,却运行着10个程序 , 这10个程序共占用3G的空间,也就意味着需要从硬盘复制 3G 的数据到内存,这显然是不可能的 。
操作系统(Operating System,简称 OS)为我们解决了这个问题:当程序运行需要的空间大于内存容量时,会将内存中暂时不用的数据再写回硬盘;需要这些数据时再从硬盘中读取,并将另外一部分不用的数据写入硬盘 。这样 , 硬盘中就会有一部分空间用来存放内存中暂时不用的数据 。这一部分空间就叫做虚拟内存(Virtual Memory) 。
3G - 2G = 1G,上面的情况需要在硬盘上分配 1G 的虚拟内存 。
硬盘的读写速度比内存慢很多,反复交换数据会消耗很多时间 , 所以如果你的内存太小,会严重影响计算机的运行速度,甚至会出现”卡死“现象 , 即使CPU强劲,也不会有大的改观 。如果经济条件允许,建议将内存升级为 4G , 在 win7、win8 下运行软件就会比较流畅了 。
总结:CPU直接从内存中读取数据,处理完成后将结果再写入内存 。
图1:CPU、内存、硬盘和主板的关系
二、数据在内存中的存储方式
计算机要处理的信息是多种多样的,如十进制数、文字、符号、图形、音频、视频等,这些信息在人们的眼里是不同的 。但对于计算机来说,它们在内存中都是一样的,都是以二进制的形式来表示 。要想学习编程 , 就必须了解二进制,它是计算机处理数据的基础 。
内存条是一个非常精密的部件,包含了上亿个电子元器件,它们很?。?达到了纳米级别 。这些元器件,实际上就是电路;电路的电压会变化,要么是 0V,要么是 5V,只有这两种电压 。5V 是通电 , 用1来表示,0V 是断电,用0来表示 。所以,一个元器件有2种状态,0 或者 1 。
我们通过电路来控制这些元器件的通断电,会得到很多0、1的组合 。例如,8个元器件有 28=256 种不同的组合 , 16个元器件有 216=65536 种不同的组合 。虽然一个元器件只能表示2个数值,但是多个结合起来就可以表示很多数值了 。
我们可以给每一种组合赋予特定的含义 , 例如,可以分别用 1101000、00011100、11111111、00000000、01010101、10101010 来表示 C、语、言、中、文、网 这几个字 , 那么结合起来 1101000 00011100 11111111 00000000 01010101 10101010 就表示”C语言中文网“ 。
一般情况下我们不一个一个的使用元器件,而是将8个元器件看做一个单位,即使表示很小的数,例如 1,也需要8个,也就是 00000001 。
1个元器件称为1比特(Bit)或1位,8个元器件称为1字节(Byte),那么16个元器件就是2Byte,32个就是4Byte,以此类推:
- 8×1024个元器件就是1024Byte,简写为1KB;
- 8×1024×1024个元器件就是1024KB,简写为1MB;
- 8×1024×1024×1024个元器件就是1024MB,简写为1GB 。
单位换算:
- 8 Bit = 1Byte
- 1024Byte = 1KB
- 1024KB = 1MB
- 1024MB = 1GB
- 1024GB = 1TB
这是经常容易混淆的一个点 。
ASCII码
我们知道,一个二进制位(Bit)有0、1两种状态,一个字节(Byte)有8个二进制位,有256种状态,每种状态对应一个符号 , 就是256个符号,从0000000到11111111 。
计算机诞生于美国,早期的计算机使用者大多使用英文 , 上世纪60年代,美国制定了一套英文字符与二进制位的对应关系,称为ASCII码,沿用至今 。
ASCII码规定了128个英文字符与二进制的对应关系,占用一个字节(实际上只占用了一个字节的后面7位,最前面1位统一规定为0) 。例如,字母 a 的的ASCII码为 01100001 , 那么你暂时可以理解为字母 a 存储到内存之前会被转换为 01100001,读取时遇到 01100001 也会转换为 a 。
完整的ASCII码表请查看:http://www.asciima.com/Unicode编码
随着计算机的流行,使用计算机的人越来越多 , 不仅限于美国,整个世界都在使用 , 这个时候ASCII编码的问题就凸现出来了 。
ASCII编码只占用1个字节,最多只能表示256个字符 , 我大中华区10万汉字怎么表示,日语韩语拉丁语怎么表示?所以90年代又制定了一套新的规范 , 将全世界范围内的字符统一使用一种方式在计算机中表示,这就是Unicode编码(Unique Code) , 也称统一码、万国码 。
Unicode 是一个很大的集合,现在的规模可以容纳100多万个符号,每个符号的对应的二进制都不一样 。Unicode 规定可以使用多个字节表示一个字符 , 例如 a 的编码为 01100001 , 一个字节就够了,”好“的编码为 01011001 01111101,需要两个字节 。
为了兼容ASCII , Unicode 规定前0~127个字符与ASCII是一样的,不一样的只是128~255的这一段 。