sjfxq 发表于 2020-3-15 13:13

新人求助Python爬虫

各位大佬,本人是一个自学Python的小白,在第一次尝试写一个自己需要的爬虫时遇到了几个问题,(因为新手的缘故,所以我使用的selenium库)

一、网页中点击测试的a标签id全部一样,包含a标签的div的class也是一样的。请问要怎么样区分它们,或者说不需要去区分它们。
二、在试题解析页面,存放题目的div的class是div[@class="sec2 grays Answer1] div[@class="sec2 grays Answer2] 这样的
我应该要怎么爬取。
三、存放答案的标签和问题一是一样的标签的class和id完全一样。每次都重复爬取第一题的答案,无法获取其他题目的答案。
萌新在线求救,感谢各位大佬!!!

繁华中的沉寂 发表于 2020-3-15 14:27

用正则表达式应该能取出来的吧

sjfxq 发表于 2020-3-15 14:34

繁华中的沉寂 发表于 2020-3-15 14:27
用正则表达式应该能取出来的吧

正则用的还不是很熟练,而且用正则不是找不到就是一直重复一个。

ciker_li 发表于 2020-3-15 15:48

再学习正则表达式吧。

sjfxq 发表于 2020-3-15 16:00

ciker_li 发表于 2020-3-15 15:48
再学习正则表达式吧。

好的,谢谢。
页: [1]
查看完整版本: 新人求助Python爬虫