吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 2149|回复: 7
收起左侧

[Python 转载] Python合并CSV文件

[复制链接]
Benjamin00 发表于 2022-4-4 16:34
         最近在合并CSV文件,C#写比较麻烦,发现Python写好方便。
         可以处理中文字符,可以选择是否去掉重复行。
import pandas as pd
import glob

outputfile = 'Merge.csv'

csv_list = glob.glob("F:/Files/*.CSV")
print(u'发现%sCSV文件' % len(csv_list))
print(u'开始处理..........')


def merge():
    count=0
    for inputfile in csv_list:
        f = open(inputfile, 'r',  encoding='utf_8_sig')
        data = pd.read_csv(f)

        if count == 0:
            data.to_csv(outputfile, mode='a', index=False, header=True, encoding='utf_8_sig')
        else:
            data.to_csv(outputfile, mode='a', index=False, header=None, encoding='utf_8_sig')

        count += 1
    print("完成合并")


def eliminate_duplicates(file):
    df = pd.read_csv(file, header=0)
    datalist = df.drop_duplicates()
    datalist = datalist.loc[:, ~datalist.columns.str.contains('Unnamed')]
    datalist.to_csv(file, ',', index=False,  encoding='utf_8_sig')
    print('完成去重')


if __name__ == '__main__':
    merge()
    eliminate_duplicates(outputfile)

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

zucker 发表于 2022-4-4 17:20
不如bat文件
wycdd 发表于 2022-4-4 17:43
ilpj 发表于 2022-4-4 18:08
dmiss 发表于 2022-4-4 18:10
过来瞧瞧热闹
 楼主| Benjamin00 发表于 2022-4-4 19:03

bat去重不好写。有没分享?
zohoChou 发表于 2022-4-4 21:06
concat???
zucker 发表于 2022-4-5 10:52
Benjamin00 发表于 2022-4-4 19:03
bat去重不好写。有没分享?

我只用过bat合并txt
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-25 06:31

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表