当前位置:主页 > 软件编程 > Python代码 >

python过滤中英文标点符号的实例代码

时间:2020-10-22 22:56:58 | 栏目:Python代码 | 点击:

如下所示:

import re
 
# 过滤不了\\ \ 中文()还有――――
r1 = u'[a-zA-Z0-9'!"#$%&\'()*+,-./:;<=>?@,。?★、…【】《》?“”‘'![\\]^_`{|}~]+'#用户也可以在此进行自定义过滤字符
 
 
# 者中规则也过滤不完全
r2 = "[\s+\.\!\/_,$%^*(+\"\']+|[+――!,。?、~@#¥%……&*()]+"
 
 
# \\\可以过滤掉反向单杠和双杠,/可以过滤掉正向单杠和双杠,第一个中括号里放的是英文符号,第二个中括号里放的是中文符号,第二个中括号前不能少|,否则过滤不完全
r3 = "[.!//_,$&%^*()<>+\"'?@#-|:~{}]+|[――!\\\\,。=?、:“”‘'《》【】¥……()]+"
 
 
# 去掉括号和括号内的所有内容
r4 = "\\【.*?】+|\\《.*?》+|\\#.*?#+|[.!/_,$&%^*()<>+""'?@|:~{}#]+|[――!\\\,。=?、:“”‘'¥……()《》【】]"
 
 
text = "\崔芸,\\我爱=+你!【我//""们】~――――结/婚'吧::!这.!!_#??()个‘'“”¥$主|意()不错......!"
 
 
print(re.sub(r1, , '', text))

您可能感兴趣的文章:

相关文章