python 文本 maketrans 和 translate
场景:
过滤字符串的某些字符,我们从例子出发
>>> tb=str.maketrans ('abc','123')
>>> 'abcd'.translate (tb)
'123d'
>>> 'abcd+++a+b+cd'.translate (tb)
'123d+++1+2+3d'
>>>
1. 建立字符映射表,也就是 maketrans 方法所做的事情,它返回一个字符串的映射表,意思是:如果字符串里面出现a,那么它就会变成对应的 1,如此类推,b->2,c->3
2. 使用 translate 方法,将字符串里面的字符改掉
注意:
1. 映射两遍的长度必须一致,不然报错,也就是说 'abc' 一定需要对于 '123' 或者 '234' 等,不能是 'abc' 对应 '12',这个时候就报错
>>> tb=str.maketrans ('abc','12')
Traceback (most recent call last):
File "", line 1, in
tb=str.maketrans ('abc','12')
ValueError: the first two maketrans arguments must have equal length
>>>
2. 还需要注意的是,字符串的 translate 方法只接受一个参数,而 bytes 的 translate 方法是可以接收两个参数,而且第二个参数可以快速实现删除方法
>>> bytes_tb = bytes.maketrans(b'abcd', b'ABCD')
>>> b'abcdefg'.translate (bytes_tb,b'a')
b'BCDefg'
>>>
下面列举一些 translate 的一些应用方法:(注意:为了快速实现删除,所以下面的方法都是用 bytes 的 translate)
修改某些字符串:
>>> def AToB(seq,frm,to):
if len(frm)or len(frm)>len(to):return '映射字符长度不一致'
else:
bytes_tb = bytes.maketrans(frm,to)
return seq.translate (bytes_tb)
>>> AToB(b'abcd',b'a',b't1')
'映射字符长度不一致'
>>> AToB(b'abcd',b'a1',b't')
'映射字符长度不一致'
>>> AToB(b'abcd',b'a',b't')
b'tbcd'
>>>
删除某些字符串:
>>> def AToB(seq,delete):
return seq.translate (None,delete)
>>> AToB(b'abcd',b'a')
b'bcd'
>>>
保留某些字符:
>>> def AToB(seq,keep):
delete=seq.translate (None,keep)
return seq.translate (None,"font-family: Arial, Helvetica, sans-serif;">delete)
>>> AToB(b'abcd',b'a')
b'a'
>>>
请发表评论