Python字符串中一个汉字占几个字节?
发布时间:2026-03-24 19:51:48

在utf-8编码下,Python中的字符汉字占三个字节,在gbk编码下占两个字节。
1、utf-8编码下Python中的汉字示例:

2、gbk编码下Python中的汉字示例:

UTF-8是Unicode的一种实现方式,即其字节结构有特殊要求,所以我们说一个汉字的范围是0X4E00到0x9FA5,是指Unicode值。至于UTF-8的代码,它是由三个字节组织的,所以我们可以看到Unicode给出了一个字符的范围,并定义了这个字的代码值。至于具体的实现方法,可以实现多种多样。
GBK全称“汉字内码扩展规范”,GBK编码,是基于GB2312-80标准的内码扩展规范,采用双字节编码方案,其编码范围从8140到FEFE(不包括xx7F),共有23940个码位,共有21003个汉字,与GB2312-80标准完全兼容。
下一篇 返回列表
