好友
阅读权限10
听众
最后登录1970-1-1
|
最近在合并CSV文件,C#写比较麻烦,发现Python写好方便。
可以处理中文字符,可以选择是否去掉重复行。
import pandas as pd
import glob
outputfile = 'Merge.csv'
csv_list = glob.glob("F:/Files/*.CSV")
print(u'发现%s个CSV文件' % len(csv_list))
print(u'开始处理..........')
def merge():
count=0
for inputfile in csv_list:
f = open(inputfile, 'r', encoding='utf_8_sig')
data = pd.read_csv(f)
if count == 0:
data.to_csv(outputfile, mode='a', index=False, header=True, encoding='utf_8_sig')
else:
data.to_csv(outputfile, mode='a', index=False, header=None, encoding='utf_8_sig')
count += 1
print("完成合并")
def eliminate_duplicates(file):
df = pd.read_csv(file, header=0)
datalist = df.drop_duplicates()
datalist = datalist.loc[:, ~datalist.columns.str.contains('Unnamed')]
datalist.to_csv(file, ',', index=False, encoding='utf_8_sig')
print('完成去重')
if __name__ == '__main__':
merge()
eliminate_duplicates(outputfile)
|
|
发帖前要善用【论坛搜索】功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。 |
|
|
|
|