好友
阅读权限 10
听众
最后登录 1970-1-1
axwa
发表于 2021-2-19 09:52
本帖最后由 axwa 于 2021-4-19 08:17 编辑
求助:用python lxml和xpath爬取网页题库(有判断、单选、多选题),单独写的问题和答案的xpath都能提取出来,但是用循环时,多选题答案只有一个(且答案是前面多选题的答案往后排的),请问如何解决?谢谢了
1到20为判断题 21到40为单选题 41到50为多选题
这个是我写的循环爬出来的多选答案只匹配了一个:
e = etree.HTML(page)
questions = e.xpath('//div[@class="question_title sj_no"]/text()' )
answers = e.xpath('//label[@class="sj_sysans"]/text()' )
for question, answer in zip (questions, answers):
print (question, answer)
下列选项中,关于未来推进完善“一国两制”制度体系,属于近期目标的选项有()。 B.团结广大台湾同胞共同反对
这个是正确的答案:
['下列选项中,关于未来推进完善“一国两制”制度体系,属于近期目标的选项有()。'] [' B.团结广大台湾同胞共同反对', ' C.保障台湾同胞福祉的制度安排和政策措施', ' D.完善促进两岸交流合作', ' E.深化两岸融合发展']
发帖前要善用【论坛搜索 】 功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。