好友
阅读权限10
听众
最后登录1970-1-1
|
扑飞漫画 http://www.pufei8.com/manhua/,能爬下来章节
def parse_html(self,url):
#http://www.pufei8.com/manhua/1783/376960.html
#http://www.pufei8.com/skin/2014mh/1.js
req = requests.get(url,headers=self.headers)
#编码格式 为国标
if req.encoding == 'ISO-8859-1':
req.encoding = "gbk"
data = req.text
with open('jd.html','w',encoding='utf-8') as f:
f.write(data)
res_html=etree.HTML(data)
#<span id="viewpagename">第1页</span>
table_view = res_html.xpath(".//span[@id='viewpagename']/text()")
#<select onchange="gopage(this)"><option value="1">第1页</option><option value="2">第2页</option><option value="3" selected="selected">第3页</option><option value="4">第4页</option><option value="5">第5页</option><option value="6">第6页</option><option value="7">第7页</option><option value="8">第8页</option><option value="9">第9页</option><option value="10">第10页</option><option value="11">第11页</option><option value="12">第12页</option><option value="13">第13页</option><option value="14">第14页</option><option value="15">第15页</option><option value="16">第16页</option><option value="17">第17页</option><option value="18">第18页</option><option value="19">第19页</option><option value="20">第20页</option><option value="21">第21页</option><option value="22">第22页</option><option value="23">第23页</option><option value="24">第24页</option><option value="25">第25页</option><option value="26">第26页</option><option value="27">第27页</option><option value="28">第28页</option><option value="29">第29页</option><option value="30">第30页</option><option value="31">第31页</option><option value="32">第32页</option><option value="33">第33页</option><option value="34">第34页</option><option value="35">第35页</option><option value="36">第36页</option><option value="37">第37页</option><option value="38">第38页</option><option value="39">第39页</option><option value="40">第40页</option><option value="41">第41页</option><option value="42">第42页</option><option value="43">第43页</option><option value="44">第44页</option><option value="45">第45页</option><option value="46">第46页</option><option value="47">第47页</option><option value="48">第48页</option><option value="49">第49页</option><option value="50">第50页</option><option value="51">第51页</option><option value="52">第52页</option><option value="53">第53页</option></select>
view_num = res_html.xpath(".//select[@onchange='gopage(this)']/option/text()")
print(view_num[-1])
pass
但是具体的章节下载不知道怎么弄了。 |
|
发帖前要善用【论坛搜索】功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。 |
|
|
|
|