编程基础之计算机中信息的存储
一文深入理解计算机底层数据信息的存储形式,以及数据存储单位 B、KB、MB、GB、TB、PB、EB 等概念。
更多相关编程基础内容,请关注博主 Hexo 博文系列:
我们知道,计算机要处理的信息是多种多样的,如数字、文字、符号、图形、音频、视频等,这些信息在人们的眼里是不同的,那么计算机是如何存储以及管理这些丰富多样的数据呢?!!
数据在内存/磁盘中的存储
事实上,由于计算机的硬件决定,数据在内存中都是一样的,都是以二进制的形式来表示,它是计算机处理数据的基础。
↓↓↓↓↓↓ 以内存条为例 ↓↓↓↓↓↓
内存条是一个非常精密的部件,包含了上亿个微小的(纳米级别)电子元器件。这些元器件,实际上就是电路,电路的电压会变化,要么是 0V
,要么是 5V
,只有这两种电压(门电路)。5V
是通电,用 1
来表示,0V
是断电,用 0
来表示。所以,一个元器件有 2
种状态:0
或者 1
。
这也就说明,对于计算机中底层存储 >>>>
计算机只能识别
0
&&1
两种数据,任何存储于计算机中的数据,其本质都是以二进制码形式存储。
[0 && 1] 组合表示丰富的数据信息 >>>>
我们可以通过电路来控制这些元器件的通断电,会得到很多 0
、1
的组合。
例如,8
个元器件有 2^8=256
种不同的组合,16
个元器件有 2^16=65536
种不同的组合。虽然一个元器件只能表示 2
个数值,但是多个结合起来就可以表示很多数值了。
同时,我们可以给每一种组合赋予特定的含义。例如,可以分别用 1101000
、00011100
、11111111
、00000000
来表示 我
、爱
、中
、国
这几个字,那么结合起来 1101000 00011100 11111111 00000000
就表示:“我爱中国”。这样不就可以存储文本了么?!!
实际上,也确实是这样用的,详情请参考 >>>> 【编程基础之字符编码】。
比特(bit)&& 字节(Byte) >>>>
一般情况下,我们不一个一个的使用元器件,而是将 8
个元器件看做一个单位。这样,即使表示一个很小的数,例如 1
,也需要 8
个,也就是 00000001
。
1 个元器件称为 1 Bit(比特)
,8 个元器件统称为 1 Byte(字节)
。那么 16
个元器件就是 2 Byte
,32
个就是 4 Byte
,以此类推:
8 × 1024
个元器件就是1024 Byte
,简写为1KB
;8 × 1024 × 1024
个元器件就是1024 KB
,简写为1MB
;8 × 1024 × 1024 × 1024
个元器件就是1024 MB
,简写为1GB
。
现在,你知道 1GB
的内存有多少个元器件了吧?!!
B、KB、MB、GB、TB、PB、EB >>>>
我们通常所说的文件大小是多少多少 KB,多少多少 MB,就是指占用了多少字节。
单位换算 >>>>
- 1 Byte = 8 Bit
- 1 KB = 1024 Byte = 2^10 Byte
- 1 MB = 1024 KB = 2^20 Byte
- 1 GB = 1024 MB = 2^30 Byte
- 1 TB = 1024 GB = 2^40 Byte
- 1 PB = 1024 TB = 2^50 Byte
- 1 EB = 1024 PB = 2^60 Byte
平时使用计算机时,通常只会设计到 KB、MB、GB、TB 这几个单位,PB 和 EB 这两个高级单位一般在大数据处理过程中才会用到。
500 GB 硬盘的实际容量 >>>>
当你购买了一块 500 GB 的硬盘,回来接到 Windows 下却显示没有 500 GB,买到假的了?!!
实际硬盘空间之所以跟标准计算有差距是因为换算的问题。只是由于硬件厂商在生产时是按照 1MB=1000KB
来算的,而 Windows 系统是按照 1MB=1024KB
来进行计算显示的。所以:
N GB 硬盘的实际容量 ≈ (N × 1000 × 1000 × 1000) / (1024 × 1024 × 1024) ≈ (N × 10^9) / (2^30) ≈ 0.93N
故,500 GB ≈ 465 GB
| ================================================== Split Line =============================================== |
总结一下:
你看,在内存中没有 abc
这样的字符,也没有 gif、jpg 这样的图片,只有 0
和 1
两个数字,计算机也只认识 0
和 1
。所以,计算机使用二进制,写入内存或磁盘中的数据都会被转换成 0
和 1
的组合。
install_url
to use ShareThis. Please set it in _config.yml
.