[关闭]
@songying 2018-09-04T16:41:39.000000Z 字数 5288 阅读 1417

python字符串

python数据类型


u, r, b

encode与decode

函数 描述
str.encode(encoding='UTF-8',errors='strict') 以指定的编码格式编码字符串。
bytes.decode(encoding="utf-8", errors="strict") 以指定的编码格式解码 bytes 对象

与字符串有关的内置函数

函数 描述
len(str) 返回字符串str的长度
str(对象) 将非字符串格式的str转换为字符串格式
repr(对象) 将对象转化为python解释器易读的形式

常见函数

函数 描述
str.lower() 将str中的大写字母都变为小写
str.upper() 将str中的小写字母都变为大写
str.join(sequence) 用于将序列中的元素以指定的字符连接生成一个新的字符串
str.strip([chars]) 用于移除字符串头尾指定的字符(默认为空格)
str.split(str="", num=string.count(str) 通过指定分隔符对字符串进行切片
str.count(sub, start= 0,end=len(string)) 用于统计字符串里某个字符出现的次数
str.startswith(str, beg=0,end=len(string)) 检查字符串是否是以指定子字符串开头
str.endswith(suffix[, start[, end]]) 判断字符串是否以指定后缀结尾
str.find(str, beg=0, end=len(string)) 检测字符串中是否包含子字符串 str
str.index(str, beg=0, end=len(string)) 检测字符串中是否包含子字符串 str
函数 描述
str.capitalize() 将字符串的第一个字母变成大写,其他字母变小写。
str.expandtabs(tabsize=8) 把字符串中的 tab 符号('\t')转为空格
str.title() 将str中所有单词转化为首字母大写,其余字母小写的格式

几个判断函数

函数 描述
str.isalnum() 检测字符串是否由字母和数字组成
str.isalpha() 检测字符串是否只由字母组成
str.isdigit() 检测字符串是否只由数字组成
str.isnumeric() 检测字符串是否只由数字组成。这种方法是只针对unicode对象。
str.islower() 检测字符串是否由小写字母组成
str.isupper() 检测字符串中所有的字母是否都为大写
str.isspace() 检测字符串是否只由空格组成
str.istitle() 检测字符串中所有的单词拼写首字母是否为大写,且其他字母为小写
str.isdecimal() 检查字符串是否只包含十进制字符。这种方法只存在于unicode对象

一点注意事项

字符串切片

  1. str[0] #访问字符
  2. str[0:-1] #第一个字符到倒数第二个字符
  3. str[1:5] #第2个字符到第5个字符
  4. str[2:] #第3个字符到最后一个字符
  5. str * 2 #输出字符串2次

注意: 在切片过程中,起始字符不输出,结尾字符输出,即[a:b]指的是从a+1b 中间的字符.

字符串运算符

操作符 描述
+ 字符串连接
* 重复输出字符串
[] 通过索引获取字符串中字符
[ : ] 截取字符串中的一部分
in 成员运算符 - 如果字符串中包含给定的字符返回 True
not in 成员运算符 - 如果字符串中不包含给定的字符返回 True
r/R 原始字符串 - 原始字符串:所有的字符串都是直接按照字面的意思来使用,没有转义特殊或不能打印的字符。 原始字符串除在字符串的第一个引号前加上字母"r"(可以大小写)以外,与普通字符串有着几乎完全相同的语法。
% 格式字符串

字符串格式化

  1. print ("我叫 %s 今年 %d 岁!" % ('小明', 10))
符 号 描述
%c 格式化字符及其ASCII码
%s 格式化字符串
%d 格式化整数
%u 格式化无符号整型
%o 格式化无符号八进制数
%x 格式化无符号十六进制数
%X 格式化无符号十六进制数(大写)
%f 格式化浮点数字,可指定小数点后的精度
%e 用科学计数法格式化浮点数
%E 作用同%e,用科学计数法格式化浮点数
%g %f和%e的简写
%G %f 和 %E 的简写
%p 用十六进制数格式化变量的地址
符号 功能
* 定义宽度或者小数点精度
- 用做左对齐
+ 在正数前面显示加号( + )
在正数前面显示空格
# 在八进制数前面显示零('0'),在十六进制前面显示'0x'或者'0X'(取决于用的是'x'还是'X')
0 显示的数字前面填充'0'而不是默认的空格
% '%%'输出一个单一的'%'
(var) 映射变量(字典参数)
m.n. m 是显示的最小总宽度,n 是小数点后的位数(如果可用的话)

方法

str.strip()

用于移除字符串头尾指定的字符(默认为空格)

  • 移除字符后生成的新字符串
  1. str.strip([chars]);
  2. # chars: 移除字符串头尾指定的字符

str.split

  • 通过指定分隔符对字符串进行切片,如果参数num 有指定值,则仅分隔 num 个子字符串

  • 返回分割后的字符串列表

  1. str.split(str="", num=string.count(str))
  2. # str: 分隔符,默认为所有的空字符
  3. # num: 分割次数

str.encode

  • 以指定的编码格式编码字符串。errors参数可以指定不同的错误处理方案。
  • 返回值: 返回编码后的字符串,它是一个 bytes 对象。
  1. str.encode(encoding='UTF-8',errors='strict')
  • encoding -- 要使用的编码,如: UTF-8
  • errors -- 设置不同错误的处理方案。默认为 'strict',意为编码错误引起一个UnicodeError。 其他可能得值有 'ignore', 'replace', 'xmlcharrefreplace', 'backslashreplace' 以及通过 codecs.register_error() 注册的任何值。

bytes.decode()

以指定的编码格式解码 bytes 对象。默认编码为 'utf-8'。
- 返回值: 解码后的字符串。

  1. bytes.decode(encoding="utf-8", errors="strict")
  • encoding -- 要使用的编码,如"UTF-8"。
  • errors -- 设置不同错误的处理方案。默认为 'strict',意为编码错误引起一个UnicodeError。 其他可能得值有 'ignore', 'replace', 'xmlcharrefreplace', 'backslashreplace' 以及通过 codecs.register_error() 注册的任何值。
序号 方法及描述
1 capitalize()将字符串的第一个字符转换为大写
2 center(width, fillchar)返回一个指定的宽度 width 居中的字符串,fillchar 为填充的字符,默认为空格。
3 count(str, beg= 0,end=len(string))返回 str 在 string 里面出现的次数,如果 beg 或者 end 指定则返回指定范围内 str 出现的次数
4 bytes.decode(encoding="utf-8", errors="strict")Python3 中没有 decode 方法,但我们可以使用 bytes 对象的 decode() 方法来解码给定的 bytes 对象,这个 bytes 对象可以由 str.encode() 来编码返回。
5 encode(encoding='UTF-8',errors='strict')以 encoding 指定的编码格式编码字符串,如果出错默认报一个ValueError 的异常,除非 errors 指定的是'ignore'或者'replace'
6 endswith(suffix, beg=0, end=len(string))检查字符串是否以 obj 结束,如果beg 或者 end 指定则检查指定的范围内是否以 obj 结束,如果是,返回 True,否则返回 False.
7 expandtabs(tabsize=8)把字符串 string 中的 tab 符号转为空格,tab 符号默认的空格数是 8 。
8 find(str, beg=0 end=len(string))检测 str 是否包含在字符串中,如果指定范围 beg 和 end ,则检查是否包含在指定范围内,如果包含返回开始的索引值,否则返回-1
9 index(str, beg=0, end=len(string))跟find()方法一样,只不过如果str不在字符串中会报一个异常.
10 isalnum()如果字符串至少有一个字符并且所有字符都是字母或数字则返 回 True,否则返回 False
11 isalpha()如果字符串至少有一个字符并且所有字符都是字母则返回 True, 否则返回 False
12 isdigit()如果字符串只包含数字则返回 True 否则返回 False..
13 islower()如果字符串中包含至少一个区分大小写的字符,并且所有这些(区分大小写的)字符都是小写,则返回 True,否则返回 False
14 isnumeric()如果字符串中只包含数字字符,则返回 True,否则返回 False
15 isspace()如果字符串中只包含空白,则返回 True,否则返回 False.
16 istitle()如果字符串是标题化的(见 title())则返回 True,否则返回 False
17 isupper()如果字符串中包含至少一个区分大小写的字符,并且所有这些(区分大小写的)字符都是大写,则返回 True,否则返回 False
18 join(seq)以指定字符串作为分隔符,将 seq 中所有的元素(的字符串表示)合并为一个新的字符串
19 len(string)返回字符串长度
20 [ljust(width, fillchar])返回一个原字符串左对齐,并使用 fillchar 填充至长度 width 的新字符串,fillchar 默认为空格。
21 lower()转换字符串中所有大写字符为小写.
22 lstrip()截掉字符串左边的空格或指定字符。
23 maketrans()创建字符映射的转换表,对于接受两个参数的最简单的调用方式,第一个参数是字符串,表示需要转换的字符,第二个参数也是字符串表示转换的目标。
24 max(str)返回字符串 str 中最大的字母。
25 min(str)返回字符串 str 中最小的字母。
26 [replace(old, new , max])把 将字符串中的 str1 替换成 str2,如果 max 指定,则替换不超过 max 次。
27 rfind(str, beg=0,end=len(string))类似于 find()函数,不过是从右边开始查找.
28 rindex( str, beg=0, end=len(string))类似于 index(),不过是从右边开始.
29 [rjust(width,, fillchar])返回一个原字符串右对齐,并使用fillchar(默认空格)填充至长度 width 的新字符串
30 rstrip()删除字符串字符串末尾的空格.
31 split(str="", num=string.count(str))num=string.count(str)) 以 str 为分隔符截取字符串,如果 num 有指定值,则仅截取 num 个子字符串
32 [splitlines(keepends])按照行('\r', '\r\n', \n')分隔,返回一个包含各行作为元素的列表,如果参数 keepends 为 False,不包含换行符,如果为 True,则保留换行符。
33 startswith(str, beg=0,end=len(string))检查字符串是否是以 obj 开头,是则返回 True,否则返回 False。如果beg 和 end 指定值,则在指定范围内检查。
34 [strip(chars])在字符串上执行 lstrip()和 rstrip()
35 swapcase()将字符串中大写转换为小写,小写转换为大写
36 title()返回"标题化"的字符串,就是说所有单词都是以大写开始,其余字母均为小写(见 istitle())
37 translate(table, deletechars="")根据 str 给出的表(包含 256 个字符)转换 string 的字符, 要过滤掉的字符放到 deletechars 参数中
38 upper()转换字符串中的小写字母为大写
39 zfill (width)返回长度为 width 的字符串,原字符串右对齐,前面填充0
40 isdecimal()检查字符串是否只包含十进制字符,如果是返回 true,否则返回 false。
添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注