python编码和解码区别是什么?
发布时间:2026-03-13 22:07:11

Python中编码与解码的区别:
编码 /encode:将Unicode字符串转换为特定编码格式对应的字节码的过程
解码 /decode:将特定编码格式的字节码转换为相应的Unicode字符串的过程
示例:
In[43]:'美好的生活'.encode('gbk')
Out[43]:b'xc3\xc0\xc0\xf6\xc8xcb\xc9\xfa'
In[44]:b'xc3\xc0\xc0\xf6\xc8xcb\xc9\xfa'.decode('gbk')
Out[44]:'美好的生活'
In[45]:'美好的生活'.encode('utf-8')
Out[45]:b'\xe7\xbe\x8exe4\xb8xbd\xe4\xba\xbaxe7\x94f'
In[46]:b'\xe7\xbe\x8exe4\xb8xbd\xe4\xba\xbaxe7\x94f'.decode('utf-8')
Out[46]:'美好的生活'
In[47]:b'xc3\xc0\xc0\xf6\xc8xcb\xc9\xfa'.decode('gbk').encode('utf-8')
Out[47]:b'\xe7\xbe\x8exe4\xb8xbd\xe4\xba\xbaxe7\x94f'以b开头是字节码,斜杠是字节。由此可见,一个常用的汉字在用GBK格式编码后被占用 2 用UTF-8格式编码个字节 3 个字节。由于UTF-8也用于存储或传输,因此一个汉字所占的空间是 3 个字节。
字符串长度和字节码长度:
In[61]:len('美好的生活')
Out[61]:4
In[62]:len(b'\xe7\xbe\x8exe4\xb8xbd\xe4\xba\xbaxe7\x94f')
Out[62]:12请关注Python自学网了解更多Python知识。
下一篇 返回列表
