好友
阅读权限30
听众
最后登录1970-1-1
|
本帖最后由 QingYi. 于 2021-6-24 22:46 编辑
拿着网站练手
"https://www.yalayi.com/"
如果大家有这种网址的话,请私信或者评论发我。 (需要正规的 不露点的)
如果大家有vip的话,可以私信发我。
[Python] 纯文本查看 复制代码 import os
import requests
from lxml import etree
import urllib
url = "https://www.yalayi.com/"
resp = requests.get(url)
# 会乱码 设置一下编码
resp.encoding = "utf-8"
html = etree.HTML(resp.text)
link = html.xpath("//div[@class='main']/div[3]/div[1]/ul/li/div/a/@href")
for item in link:
# 拿到 url = "https://www.yalayi.com/" 这个url下面的子url =》 get pictures
resp = requests.get(item)
resp.encoding = "utf-8"
# 再次进入xpath
sub_page = etree.HTML(resp.text)
# print(resp.text)
# get download links
download_link = sub_page.xpath("//img[@class='lazy']/@data-original")
# make dir
if not os.path.exists("pic"):
os.mkdir("pic")
# name count
i = 0
name = sub_page.xpath("//img[@class='lazy']/@alt")
for download in download_link:
urllib.request.urlretrieve(download, "pic/{}.jpg".format(name[i]))
print("%s下载完毕" % name[i])
i += 1
# break
|
免费评分
-
查看全部评分
|
发帖前要善用【论坛搜索】功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。 |
|
|
|
|