吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 1009|回复: 3
收起左侧

[学习记录] python利用正则表达式提取文本中的金额

[复制链接]
zhzhx 发表于 2023-2-16 16:16
[Python] 纯文本查看 复制代码
import re

Regx = re.compile("(([1-9]\\d*[\\d,,]*\\.?\\d*)|(0\\.[0-9]+))(元|百万|万元|亿元|万|亿)")

# 对整个文本进行分句,根据个人统计和测试,只需要用逗号对文本分句足矣
def cutFun(initial_txt):
    result = re.split('。', initial_txt)
    return result


def YUAN_contain(content, temp_result_set):
    str = '元'
    for term in cutFun(content):
        if str in term:
            temp_result_set.add(term)


def get_price(txt):
    """获取价格"""
    price = 0
    # 符合要求的文本加入集合中
    # 如果一个句子中有“元”那么将该句子存放在一个临时变量中以供试用
    temp_result_set = set()
    YUAN_contain(txt, temp_result_set)
    # 将temp_result_set中含有数字的句子分离出来
    # 最终结果为一个集合
    result_set = set()
    for term in temp_result_set:
        for ch in term:
            if ch.isdigit():
                result_set.add(term)

    # 用正则式提取金额
    for term in result_set:
        i = Regx.search(term)
        if i != None:
            price = i.group()
    return price

免费评分

参与人数 1吾爱币 +1 收起 理由
ma4907758 + 1 谢谢@Thanks!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

zhangsan2022 发表于 2023-2-16 17:35
多谢分享。
头像被屏蔽
ysjd22 发表于 2023-2-16 19:45
debug_cat 发表于 2023-2-16 22:15
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-25 01:22

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表