人类与电脑是怎么交流的?先来看懂二进制与字符编码( 五 )

字节码转换

上面如果编码写错时 , 会出现乱码了吗?这是因为编码对照表写错 , 导致对应的字符产生误差的原因 。

常用的编码表问ASCII系统 , 因为这个编码系统中 , 每个符号都会占用一个字节的记录 , 因此总共会有2的8次方中变化 。 至于中文当中的编码系统早期使用的时GB2312这个编码表 , 每个汉字会占用2字节 , 理论上最多可以有2的16次方也就是65536 , 最多6多个汉字 。

ASCII系统

GB2312的中文编码对于一些数据系统来说时很有问题的 , 比如一些汉字”许、功“等字 , 由于这几个字的内部编码会被误判为单双引号 , 在写入还不成问题 , 在读写数据的对照表中 , 常常就会变成乱码 。 不只是中文 , 其他非英语也常常会遇到这样的问题 。

GB2312中文编码

为了解决这个问题 , 国际组织ISO/IEC制定了所谓的Unicode编码系统 , 我们常常称为UTF-8或万国码的这个东西 。 因为这个编码系统打破了所有不同国家的不同编码 , 因此目前互联网网站大多以此编码系统为主 。

推荐阅读