博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
python中的字符编码
阅读量:5105 次
发布时间:2019-06-13

本文共 852 字,大约阅读时间需要 2 分钟。

字符编码需要记住的概念

1.内存中固定使用的unicode编码 ,我们唯一可以改变的是存储到硬盘时使用的编码格式

2.要想保证存储的文件不乱码,应该保证文件当初是什么编码格式格式存的,就以什么编码格式读取

Unicode-------编码----gbk

unicode《------解码-------gbk
python2通过文件头指定文件编码

#coding:gpk & utf-8

 

GBK:用2Bytes表示一个中文字符,1Bytes去表示英文字符

utf-8 用1Bytes表示英文,用3Bytes表示中文 #默认使用
unicode:内存中使用的是unicode编码,unicode把全世界的字符
都建立好对应关系用2Bytes去表示一个字符
ASCII码表:用1Bytes表示一个英文字符,1英文字符=8bit=1Bytes

美国人用的

 

python3 默认使用编码是utf-8

Python2 默认使用编码是 Ascll

在python2中有两种字符串编码格式

1.unicode:
x=u’上‘ 字符前面加u
2.unidoce编码后
x=’上‘ 若果文件头 coding:utf-8那么上被存成utf-8格式
python3中只要一种字符串编码格式
1.unicode
x=’上’

2.编码与解码

    unicode----------编码encode-----》gbk

    unicode《-------解码decode-----gbk

总结python3

在pyhton2中的字符串类型str都是unicode按头文件指定编码
在python2中也可以制造unicode,需要在字符串前加u       

 

现在统一默认都是使用utp-8编码,避免出现乱码

在python3中字符串类型str都是unicode编码的
所有python3中的字符串类型可以编码成其他字符编码格式,

 

编码的结果是Bytes类型

 

 

 

转载于:https://www.cnblogs.com/Marcki/p/10111971.html

你可能感兴趣的文章
#Leetcode# 209. Minimum Size Subarray Sum
查看>>
SDN第四次作业
查看>>
DM8168 DVRRDK软件框架研究
查看>>
django迁移数据库错误
查看>>
yii 跳转页面
查看>>
洛谷 1449——后缀表达式(线性数据结构)
查看>>
Data truncation: Out of range value for column 'Quality' at row 1
查看>>
Dirichlet分布深入理解
查看>>
(转)Android之发送短信的两种方式
查看>>
字符串处理
查看>>
HtmlUnitDriver 网页内容动态抓取
查看>>
ad logon hour
查看>>
获得进程可执行文件的路径: GetModuleFileNameEx, GetProcessImageFileName, QueryFullProcessImageName...
查看>>
证件照(1寸2寸)拍摄处理知识汇总
查看>>
罗马数字与阿拉伯数字转换
查看>>
Eclipse 反编译之 JadClipse
查看>>
Python入门-函数
查看>>
[HDU5727]Necklace(二分图最大匹配,枚举)
查看>>
距离公式汇总以及Python实现
查看>>
设计模式之装饰者模式
查看>>