吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 1013|回复: 4
收起左侧

[求助] 新人求助Python爬虫

[复制链接]
sjfxq 发表于 2020-3-15 13:13
各位大佬,本人是一个自学Python的小白,在第一次尝试写一个自己需要的爬虫时遇到了几个问题,(因为新手的缘故,所以我使用的selenium库

一、网页中点击测试的a标签id全部一样,包含a标签的div的class也是一样的。请问要怎么样区分它们,或者说不需要去区分它们。
二、在试题解析页面,存放题目的div的class是div[@class="sec2 grays Answer1] div[@class="sec2 grays Answer2] 这样的
我应该要怎么爬取。
三、存放答案的标签和问题一是一样的标签的class和id完全一样。每次都重复爬取第一题的答案,无法获取其他题目的答案。

萌新在线求救,感谢各位大佬!!!

包含点击测试按钮的div

包含点击测试按钮的div

存放题目的div-class

存放题目的div-class

试题解析页面

试题解析页面

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

繁华中的沉寂 发表于 2020-3-15 14:27
用正则表达式应该能取出来的吧
 楼主| sjfxq 发表于 2020-3-15 14:34
繁华中的沉寂 发表于 2020-3-15 14:27
用正则表达式应该能取出来的吧

正则用的还不是很熟练,而且用正则不是找不到就是一直重复一个。
ciker_li 发表于 2020-3-15 15:48
 楼主| sjfxq 发表于 2020-3-15 16:00
ciker_li 发表于 2020-3-15 15:48
再学习正则表达式吧。

好的,谢谢。
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-26 19:57

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表