吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 2598|回复: 10
收起左侧

[Python 原创] 银行账单(建行/招商)转换beancount

[复制链接]
平Fan_d世界 发表于 2023-11-3 18:59
本帖最后由 平Fan_d世界 于 2023-11-3 19:48 编辑

用了beancount来记账后,发现每月的账单手动记是一件极其麻烦的事情。

然后再github搜索一通后,有double-entry-generator(https://github.com/deb-sig/double-entry-generator)能转换支付宝/微信的账单,但是没有自己用的建行和招商。
所有自己写了一个py:
  • 建行能导出的账单是excel格式的直接用;
  • 招商导出的是pdf,幸好还能转成txt,然后自己整理成csv
  • 后续可能会加上深农商和农行,也可能不会,这两张卡用的不多。

代码如下:
[Python] 纯文本查看 复制代码
import os
import re
import pandas as pd
import numpy as np

dir = os.path.dirname(os.path.abspath(__file__))

#input_file = "xxxxxx.csv"
input_file = input("输入账单路径:")
bank = input("输入账单归属银行[CCB、CMB、SRCB、ABC]:")     #暂时只有CCB和CMB
output_file = dir + "\\" + bank + ".bean"
config_file = dir + "\\config\\" + bank + ".conf"     #当前config文件夹下的CCB.conf和CMB.conf。

#CCB账单excel的整理
def CCB_data(_file_):
        data = pd.read_excel(_file_)
        data.columns = ["No","text0","CCY","Yuan","time","cost","bal","text1","text2"]
        data = data.iloc[2:]
        #data["time"] = data["time"].str[0:4] + "-" + data["time"].str[4:6] + "-" + data["time"].str[6:8]
        data["time"] = pd.to_datetime(data["time"]).astype(str)
        data.loc[:,"account"] = data["text0"] + ":" + data["text2"]
        data["CCY"] = data["CCY"].replace("人民币元","CNY")
        data = data[["time","cost","CCY","account","text0","text1","text2"]]
        #pd.DataFrame(data).to_csv(output_file+".csv",encoding='utf-8-sig')    #可以导出csv
        return data

#CMB账单csv的整理
def CMB_data(_file_):
        data = pd.read_csv(_file_)
        data.columns = ["time","CCY","cost","bal","text0","text2"]
        data["time"] = pd.to_datetime(data["time"]).astype(str)
        data["cost"] = data["cost"].astype(str)
        data.loc[:,"text1"] = None
        data.loc[:,"account"] = data["text0"] + ":" + data["text2"]
        data = data[["time","cost","CCY","account","text0","text1","text2"]]
        #pd.DataFrame(data).to_csv(output_file+".csv",encoding='utf-8-sig')      #可以导出csv
        return data
 
#关键字查找替换       
def replace(_data_,_config_):        
        conf = pd.read_csv(_config_)
        for conf in conf.itertuples():
                _data_ = _data_.str.replace(".*"+conf[1]+".*",conf[2],regex = True)
        return _data_

#输出beancount格式的字段
def to_bean(_data_):
        global bank
        bean = _data_["time"] + ' * \"' +_data_["text0"] + '\"\n\t'
        if _data_["text1"].notnull().any():
                bean = bean + 'notes: \"' + _data_["text1"] + '\"\n\t' 
        bean = bean + 'id: \"' + _data_["text2"] + '\"\n\t'
        bean = bean + "Assets:Bank:" + bank + " " + _data_["cost"] + " " + _data_["CCY"] + "\n\t"
        bean = bean + _data_["account"] + "\n"
        
        return bean

#整理账单格式    
if bank == "CCB":
        DATA = CCB_data(input_file)
if bank == "CMB":
        DATA = CMB_data(input_file)

#按conf文件查找替换关键字
DATA["account"]= replace(DATA["account"],config_file)
#print(DATA)

#整理为beancount格式的字段
bean = to_bean(DATA).to_frame()
#print(bean)

#输出文件CCB.bean或者CMB.beantext = ""
for bean in bean.itertuples():
        text = text + str(bean[1]) + "\n"

file = open(output_file,'w')
file.write(text)
file.close()



config文件,格式:【关键字,替换后】,例如:
[Python] 纯文本查看 复制代码
Text,Replace_text
饿了么,Expenses:Food:Others


效果如下:


免费评分

参与人数 1吾爱币 +7 热心值 +1 收起 理由
苏紫方璇 + 7 + 1 欢迎分析讨论交流,吾爱破解论坛有你更精彩!

查看全部评分

本帖被以下淘专辑推荐:

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

13729181580 发表于 2023-11-3 19:06
感谢分享!
chayunyuxiang 发表于 2023-11-3 19:16
 楼主| 平Fan_d世界 发表于 2023-11-3 19:33
SSSPZ 发表于 2023-11-3 19:45
感谢楼主的成品,膜拜大佬
sai609 发表于 2023-11-3 21:37
银行流水等表格类表单,pdf或者jpg格式,有啥办法批量orc转换为excel或者csv?
 楼主| 平Fan_d世界 发表于 2023-11-3 22:00
sai609 发表于 2023-11-3 21:37
银行流水等表格类表单,pdf或者jpg格式,有啥办法批量orc转换为excel或者csv?

木的办法,就算ocr设别准确率高,格式也会乱,还是得靠人工检查
sai609 发表于 2023-11-4 10:21
平Fan_d世界 发表于 2023-11-3 22:00
木的办法,就算ocr设别准确率高,格式也会乱,还是得靠人工检查

格式是一大问题
个别数字,与上下连接页码,经常混杂没法ocr
zhangmi008 发表于 2023-11-4 10:41
sai609 发表于 2023-11-4 10:21
格式是一大问题
个别数字,与上下连接页码,经常混杂没法ocr

如果是自用的话,可以做一些简单的格式区分,手工调整的情况并不多。但是没法作为成品发布
bobxie 发表于 2023-11-5 11:57
你把pdf的转换加到pythin里,应该更好使吧
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2025-1-11 01:25

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表