吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 1624|回复: 42
上一主题 下一主题
收起左侧

[Python 原创] 爬取某省2024普法考试题库

  [复制链接]
跳转到指定楼层
楼主
xinxiu 发表于 2024-10-24 12:45 回帖奖励
2024年的普法考试又开始了,昨天晚上花了点时间把题库和答案爬了一下,好像不太全,不过考了几个都在90分以上
[Python] 纯文本查看 复制代码
import requests
import json
from pprint import pprint

headers = {
    'User-Agent': 'Mozilla/5.0 (Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/130.0.0.0 Safari/537.36)',
    'Referer':'https://exam.gxpf.cn',
    'Connection':'keep-alive',
    'cookies':'你的cookie',
    'a-code':'-86141162',
    'a-st':'时间戳',
    'a-tokenid':'你的tokenid',
    'a-userid':'你的userid'

}

url = 'https://exam.gxpf.cn/exercise.html?time=时间戳'

response = requests.get(url, headers=headers)
print(response)

urllist = 'https://exam.gxpf.cn/examapi/rest/api/exercise/getRandomExerciseLocalList'
responsep = requests.post(urllist, headers=headers,params={'position':'1','offset':'5000'})
print(responsep)
jsondata = json.loads(responsep.text)

pprint(jsondata)

# 创建一个列表来保存处理后的题目数据
processed_data = []
# 初始化题目序号
question_number = 1
# 创建一个集合来保存已经出现过的题目
seen_questions = set()

# 遍历result中的所有题目
for subject in jsondata['result'][0]['list']:
    subject_type = subject['subjectType']
    subject_name = subject['subject_name']
    detail = subject['detail']

    # 初始化一个列表来保存所有isResult为1的题目的itemQuestion
    item_questions_with_result = []

    # 遍历detail列表,提取每个题目的itemQuestion,如果isResult为1
    for item in detail:
        if item.get('isResult') == 1:
            item_questions_with_result.append(item.get('itemQuestion'))

    # 创建一个唯一的题目表示(这里假设题目内容是唯一的)
    unique_question_representation = (subject_type, subject_name, tuple(item_questions_with_result))

    # 检查题目是否已经出现过
    if unique_question_representation not in seen_questions:
        # 将题目类型、题目以及答案保存到列表中,并添加序号
        processed_data.append({
            "序号": question_number,
            "题目类型": subject_type,
            "题库题目": subject_name,
            "正确答案": item_questions_with_result
        })

        # 打印题目类型、题目以及答案,并包含序号
        print(f'序号:{question_number}')
        print(f'题目类型:{subject_type}')
        print(f'题库题目:{subject_name}')
        print(f'正确答案:{item_questions_with_result}')
        print('====================')

        # 更新题目序号和已见题目集合
        question_number += 1
        seen_questions.add(unique_question_representation)

# 指定要保存的文件名
filename = 'processed_questions_and_answers.json'

# 将处理后的数据写入JSON文件
with open(filename, 'w', encoding='utf-8') as file:
    json.dump(processed_data, file, ensure_ascii=False, indent=4)

# 输出文件名
print(f"数据已保存到 {filename}")


爬出来的题库和答案
processed_questions_and_answers.txt (1.48 MB, 下载次数: 171, 售价: 2 CB吾爱币)

免费评分

参与人数 11吾爱币 +17 热心值 +9 收起 理由
飞猫猫 + 1 + 1 谢谢@Thanks!
poptop + 1 谢谢@Thanks!
苏紫方璇 + 7 + 1 欢迎分析讨论交流,吾爱破解论坛有你更精彩!
LittleDD + 1 + 1 感谢您的宝贵建议,我们会努力争取做得更好!
linhong + 1 + 1 谢谢@Thanks!
Kls673M + 1 + 1 用心讨论,共获提升!
zpwz + 2 + 1 如何快速查询呢?
pales1gh + 1 + 1 谢谢@Thanks!
_水瓶座 + 1 + 1 我们广东都是在公众号提供题库和答案的
CoolKids + 1 用心讨论,共获提升!
wuaiwxh + 1 我很赞同!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

推荐
ZeroWong1919 发表于 2024-10-24 21:26
本帖最后由 ZeroWong1919 于 2024-10-24 21:27 编辑
dtf 发表于 2024-10-24 19:34
20多M的python-3.12.0-amd64.exe,这个是不是就是python解释器

是的,如果建议学习python,可以先参考参考下面的链接。如果只是想拿到题库数据还是建议直接下载楼主的资料,对于没有学习过编程的人而言,环境配置比较麻烦。
菜鸟教程:https://www.runoob.com/python3/python3-tutorial.html
推荐
ZeroWong1919 发表于 2024-10-24 14:54
dtf 发表于 2024-10-24 13:39
不会编程,这些代码怎么用呢?

1. 安装python解释器。
2. 将代码保存为 文件名.py
3. 命令行执行 python 文件名.py
4. 出现  moudule  XXX not found 的报错就在命令行执行 pip install XXX。
5. 重复步骤3
3#
yxh51930 发表于 2024-10-24 13:24
4#
dtf 发表于 2024-10-24 13:39
不会编程,这些代码怎么用呢?
5#
zpwz 发表于 2024-10-24 13:45
感谢GX大佬的分享!
也希望楼下的知而不言
6#
CoinsBtc 发表于 2024-10-24 14:05
感谢NB大佬的分享!
7#
 楼主| xinxiu 发表于 2024-10-24 14:08 |楼主
dtf 发表于 2024-10-24 13:39
不会编程,这些代码怎么用呢?

那你就直接下载题库得了
8#
pales1gh 发表于 2024-10-24 14:42
感谢分享
9#
huixin2017520 发表于 2024-10-24 14:48
可以,有用
10#
白水剑心 发表于 2024-10-24 14:49
看着不会用!不知道福建省的可以不?
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-24 10:10

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表