python抓取QQ看点小姐姐
from asyncore import writeimport requests , random , os
from lxml import etree
def write(url):
res = requests.get(url=url).text
bodyXML = etree.HTML(res)
imgList = bodyXML.xpath('//span[@class="bannerfix-wrapper"]/img/@data-src')
title = bodyXML.xpath('//div[@id="mod-common"]/@data-article-title')
for item in imgList:
with open(f'./img/{title}-{random.randint(0,9999)}.jpg',mode='wb') as fs:
fs.write(requests.get(url='https:'+item).content)
fs.close()
def mkdir():
static=os.path.exists('./img')
if not static:
os.makedirs('./img')
return True
else:
return False
if __name__ == '__main__':
mkdir()
url = input('请输入网址:')
write(url)
看到QQ看点有漂亮小姐姐,然后就在东拼西凑地找代码片段组合,就写下了以下的代码(大佬绕开)
酒意入桃枝 发表于 2022-7-29 14:53
每次请求时长是多少?会不会被网站注意到认为你是恶意攻击
只采一个文章,不会很多请求,如果可以加上time.sleep(1) hanzj06 发表于 2022-7-29 16:38
最失败的就是没有放小姐姐的图啊,没图没动力
还有文件名为啥要拼上0-100的随机数啊?
避免文件名重复 每次请求时长是多少?会不会被网站注意到认为你是恶意攻击 感谢楼主分享
共同学习进步 {:1_908:}小姐姐看多了身体扛不住 感谢分享!!!! QQ看点是什么新东西啊,我找都找不到{:301_1008:} 牛啊,感谢分享!!!! 哈哈 小姐姐好看不{:17_1068:} 最失败的就是没有放小姐姐的图啊,没图没动力{:1_926:}
还有文件名为啥要拼上0-100的随机数啊?
页:
[1]
2