编程基础之计算机中信息的存储

一文深入理解计算机底层数据信息的存储形式,以及数据存储单位 B、KB、MB、GB、TB、PB、EB 等概念。

更多相关编程基础内容,请关注博主 Hexo 博文系列:

计算机中信息的存储

编码详解

进制详解

机器数和算术溢出


我们知道,计算机要处理的信息是多种多样的,如数字、文字、符号、图形、音频、视频等,这些信息在人们的眼里是不同的,那么计算机是如何存储以及管理这些丰富多样的数据呢?!!

数据在内存/磁盘中的存储

事实上,由于计算机的硬件决定,数据在内存中都是一样的,都是以二进制的形式来表示,它是计算机处理数据的基础。

↓↓↓↓↓↓ 以内存条为例 ↓↓↓↓↓↓

内存条是一个非常精密的部件,包含了上亿个微小的(纳米级别)电子元器件。这些元器件,实际上就是电路,电路的电压会变化,要么是 0V,要么是 5V,只有这两种电压(门电路)。5V 是通电,用 1 来表示,0V 是断电,用 0 来表示。所以,一个元器件有 2 种状态:0 或者 1

这也就说明,对于计算机中底层存储 >>>>

计算机只能识别 0 && 1 两种数据,任何存储于计算机中的数据,其本质都是以二进制码形式存储。


[0 && 1] 组合表示丰富的数据信息 >>>>

我们可以通过电路来控制这些元器件的通断电,会得到很多 01 的组合。

例如,8 个元器件有 2^8=256 种不同的组合,16 个元器件有 2^16=65536 种不同的组合。虽然一个元器件只能表示 2 个数值,但是多个结合起来就可以表示很多数值了。

同时,我们可以给每一种组合赋予特定的含义。例如,可以分别用 1101000000111001111111100000000 来表示 这几个字,那么结合起来 1101000 00011100 11111111 00000000 就表示:“我爱中国”。这样不就可以存储文本了么?!!

实际上,也确实是这样用的,详情请参考 >>>> 【编程基础之字符编码】。


比特(bit)&& 字节(Byte) >>>>

一般情况下,我们不一个一个的使用元器件,而是将 8 个元器件看做一个单位。这样,即使表示一个很小的数,例如 1,也需要 8 个,也就是 00000001

1 个元器件称为 1 Bit(比特),8 个元器件统称为 1 Byte(字节)。那么 16 个元器件就是 2 Byte32 个就是 4 Byte,以此类推:

  • 8 × 1024 个元器件就是 1024 Byte,简写为 1KB
  • 8 × 1024 × 1024 个元器件就是 1024 KB,简写为 1MB
  • 8 × 1024 × 1024 × 1024 个元器件就是 1024 MB,简写为 1GB

现在,你知道 1GB 的内存有多少个元器件了吧?!!


B、KB、MB、GB、TB、PB、EB >>>>

我们通常所说的文件大小是多少多少 KB,多少多少 MB,就是指占用了多少字节。

单位换算 >>>>

  • 1 Byte = 8 Bit
  • 1 KB = 1024 Byte = 2^10 Byte
  • 1 MB = 1024 KB = 2^20 Byte
  • 1 GB = 1024 MB = 2^30 Byte
  • 1 TB = 1024 GB = 2^40 Byte
  • 1 PB = 1024 TB = 2^50 Byte
  • 1 EB = 1024 PB = 2^60 Byte

平时使用计算机时,通常只会设计到 KB、MB、GB、TB 这几个单位,PB 和 EB 这两个高级单位一般在大数据处理过程中才会用到。


500 GB 硬盘的实际容量 >>>>

当你购买了一块 500 GB 的硬盘,回来接到 Windows 下却显示没有 500 GB,买到假的了?!!

实际硬盘空间之所以跟标准计算有差距是因为换算的问题。只是由于硬件厂商在生产时是按照 1MB=1000KB 来算的,而 Windows 系统是按照 1MB=1024KB 来进行计算显示的。所以:

N GB 硬盘的实际容量 ≈ (N × 1000 × 1000 × 1000) / (1024 × 1024 × 1024) ≈ (N × 10^9) / (2^30) ≈ 0.93N

故,500 GB ≈ 465 GB

| ================================================== Split Line =============================================== |

总结一下:

你看,在内存中没有 abc 这样的字符,也没有 gif、jpg 这样的图片,只有 01 两个数字,计算机也只认识 01。所以,计算机使用二进制,写入内存或磁盘中的数据都会被转换成 01 的组合。


Author

Waldeinsamkeit

Posted on

2016-07-25

Updated on

2024-01-13

Licensed under

You need to set install_url to use ShareThis. Please set it in _config.yml.

Comments

You forgot to set the shortname for Disqus. Please set it in _config.yml.