欢迎来到代码驿站!

Python代码

当前位置:首页 > 软件编程 > Python代码

python将中文数字转化成阿拉伯数字的简单方法

时间:2023-03-04 10:50:49|栏目:Python代码|点击:

正则表达式提取文本中的数字

这里演示一下文本中提取中文年份

import re
m0 = "在一九四九年新中国成立比一九九零年低百分之五点二人一九九六年击败俄军,取得实质独立"
pattrern1 = '[零一二三四五六七八九]{4,}'
pattrern2 = '[?一二三四五六七八九零壹贰叁肆伍陆柒捌玖?@两]{4,}'
time1 = re.findall(pattrern1,m0)#转化数字

提取年份如:‘1949', ‘1990', ‘1996'

这里给出许多正则表达式的样例:example

中文转化成阿拉伯数字

创建一个字典然后讲数字进项匹配:

CN_NUM = {
 '?': 0, '一': 1, '二': 2, '三': 3, '四': 4, '五': 5, '六': 6, '七': 7, '八': 8, '九': 9, '零': 0,
 '壹': 1, '贰': 2, '叁': 3, '肆': 4, '伍': 5, '陆': 6, '柒': 7, '捌': 8, '玖': 9, '?@': 2, '两': 2,}

for i in range(len(time1)):
 new_str = ''
 for j in time1[i]:
 new_str += str(CN_NUM[j])
 time1[i] = new_str
time1

这样结果就出来啦,成功将上文例子中文年份转化成阿拉伯数字:‘1949', ‘1990', ‘1996'

完整代码

# 2、将句子中年份的大写数字改为阿拉伯数字
import re
m0 = "在一九四九年新中国成立比一九九零年低百分之五点二人一九九六年击败俄军,取得实质独立"
pattrern1 = '[零一二三四五六七八九]{4,}'
pattrern2 = '[?一二三四五六七八九零壹贰叁肆伍陆柒捌玖?@两]{4,}'
time1 = re.findall(pattrern1,m0)#转化数字
CN_NUM = {
 '?': 0, '一': 1, '二': 2, '三': 3, '四': 4, '五': 5, '六': 6, '七': 7, '八': 8, '九': 9, '零': 0,
 '壹': 1, '贰': 2, '叁': 3, '肆': 4, '伍': 5, '陆': 6, '柒': 7, '捌': 8, '玖': 9, '?@': 2, '两': 2,}

for i in range(len(time1)):
 new_str = ''
 for j in time1[i]:
 new_str += str(CN_NUM[j])
 time1[i] = new_str
time1

总结

上一篇:python如何设置静态变量

栏    目:Python代码

下一篇:python输出pdf文档的实例

本文标题:python将中文数字转化成阿拉伯数字的简单方法

本文地址:http://www.codeinn.net/misctech/226836.html

推荐教程

广告投放 | 联系我们 | 版权申明

重要申明:本站所有的文章、图片、评论等,均由网友发表或上传并维护或收集自网络,属个人行为,与本站立场无关。

如果侵犯了您的权利,请与我们联系,我们将在24小时内进行处理、任何非本站因素导致的法律后果,本站均不负任何责任。

联系QQ:914707363 | 邮箱:codeinn#126.com(#换成@)

Copyright © 2020 代码驿站 版权所有