Skip to content
目录概览

请简述字符编码是什么?请说出常见字符编码表?

  • 字符编码是什么? 字符编码(英语:Character encoding)也称字集码,是把字符集中的字符编码为指定集合中某一对象,以便文本在计算机中存储和通过通信网络的传递。常见的例子包括将拉丁字母表编码成摩斯电码和ASCII。其中,ASCII将字母、数字和其他符号编号,并用7比特的二进制来表示这个整数。通常会额外使用一个扩充的比特,以便以1个字节的方式存储。
  • 常见的字符编码表如下
    • ASCII
    • GB2312 是一个简体中文字符集,由6763个常用汉字和682个全角的非汉字字符组成。
    • GBK GBK编码标准兼容GB2312,共收录汉字21003个、符号883个,并提供1894个造字码位,简、繁体字融于一库
    • GB18030 是在GBK基础上增加了一部分汉字 Big5:在台湾、香港与澳门地区,使用的是繁体中文字符集
    • Unicode 将世界上所有的符号都纳入其中,无论是英文、日文、还是中文等,大家都使用这个编码表,这样就利于同一的管理,在这个编码表中每一个字符占两个字节
    • UTF-8 为了提高Unicode的编码效率,于是就出现了UTF-8编码。UTF-8可以根据不同的符号自动选择编码的长短。比如英文字母可以只用1个字节就够了。