时间:2020-10-22 22:56:58 | 栏目:Python代码 | 点击:次
如下所示:
import re # 过滤不了\\ \ 中文()还有―――― r1 = u'[a-zA-Z0-9'!"#$%&\'()*+,-./:;<=>?@,。?★、…【】《》?“”‘'![\\]^_`{|}~]+'#用户也可以在此进行自定义过滤字符 # 者中规则也过滤不完全 r2 = "[\s+\.\!\/_,$%^*(+\"\']+|[+――!,。?、~@#¥%……&*()]+" # \\\可以过滤掉反向单杠和双杠,/可以过滤掉正向单杠和双杠,第一个中括号里放的是英文符号,第二个中括号里放的是中文符号,第二个中括号前不能少|,否则过滤不完全 r3 = "[.!//_,$&%^*()<>+\"'?@#-|:~{}]+|[――!\\\\,。=?、:“”‘'《》【】¥……()]+" # 去掉括号和括号内的所有内容 r4 = "\\【.*?】+|\\《.*?》+|\\#.*?#+|[.!/_,$&%^*()<>+""'?@|:~{}#]+|[――!\\\,。=?、:“”‘'¥……()《》【】]" text = "\崔芸,\\我爱=+你!【我//""们】~――――结/婚'吧::!这.!!_#??()个‘'“”¥$主|意()不错......!" print(re.sub(r1, , '', text))