吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 1284|回复: 5
收起左侧

[Python 原创] 对大段文本进行预处理 并保存EXCEL表格

[复制链接]
jcwoai 发表于 2023-4-1 15:08
本帖最后由 jcwoai 于 2023-4-1 15:47 编辑

由于该网站考试页面需要每月一次登录考试时才能出现,自己不太会爬取,所以直接复制处理后,
再用python进行题库对比 答案也就几分钟就出来了。本人新手 如有不足请包含!
在网页上直接复制下来内容如图:

复制的内容

复制的内容


复制的内容

复制的内容


处理结果:

处理结果

处理结果


保存到excel表格中:

excel表

excel表


代码:
[Asm] 纯文本查看 复制代码
import re
import pandas as pd
def clean(line):
    line = re.sub('\nA', '\nAA', line)  # 为分段加标记
    line = re.sub('\d+.(1分).', '#', line).split('#')  # 为分割加标记,并以#号分割

    data = []
    for item in line:
        stem = item.split('\nA')[0]
        option = item.split('\nA')[1]
        dit = {
            '题干': stem,
            '选项': option
        }
        data.append(dit)

    return data


def save(data):
    df = pd.DataFrame(data)
    df.to_excel('newtg.xlsx', index=False, sheet_name='Sheet1')


def main():
    with open('1.txt', 'r', encoding='utf-8-sig') as f:
        content = f.read()
    content2 = clean(content)
    data = save(content2)
    # print(content2)
    # print(data)


if __name__ == '__main__':
    main()


免费评分

参与人数 1吾爱币 +3 热心值 +1 收起 理由
苏紫方璇 + 3 + 1 欢迎分析讨论交流,吾爱破解论坛有你更精彩!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

zq514317526 发表于 2023-4-3 08:26
这功能可以啊,楼主牛
sunyake 发表于 2023-4-3 09:08
hzxszxd 发表于 2023-4-3 20:01
fengyun123123 发表于 2023-4-5 01:10
实用,马上学习
HR741158 发表于 2023-4-7 10:10
学习了,受用
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-24 23:48

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表