好友
阅读权限30
听众
最后登录1970-1-1
|
本帖最后由 judgecx 于 2020-7-25 09:33 编辑
[Python] 纯文本查看 复制代码 import requests
from bs4 import BeautifulSoup
url='https://www.pixiv.net/ranking.php?mode=daily&content=illust'
#爬取图片详情链接
a=int(input("= "))
for i in range(0,a):
rg=requests.get(url)
rg.encoding = 'utf-8'
rg_html = BeautifulSoup(rg.text,'html.parser')
rg_pre = rg_html.prettify()
ln=1+i*2
in_url = str(rg_pre.split("artworks/")[ln].split("\"")[0])
in_url = 'https://www.pixiv.net/artworks/'+in_url
#爬取原图链接
rgi=requests.get(in_url)
rgi.enconding = 'utf-8'
rgi_html = BeautifulSoup(rgi.text,'html.parser')
rgi_pre = rgi_html.prettify()
img_url = str(rgi_pre.split("original\":\"")[1].split("\"")[0])
#伪造请求绕过限制
user = {
'Referer': in_url
}
rgid=requests.get(img_url,headers=user)
print(img_url)
#下载图片
img=rgid.content
img_type = str(img_url.split(".")[3])
img_num = i+1
with open('./'+str(img_num)+'.'+img_type,'wb') as f:
f.write(img)
只能爬五十张 麻烦大佬指点下 拜托了 |
免费评分
-
查看全部评分
|
发帖前要善用【论坛搜索】功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。 |
|
|
|
|