hitomi666 发表于 2022-7-29 12:12

python抓取QQ看点小姐姐

from asyncore import write
import requests , random , os
from lxml import etree
def write(url):
    res = requests.get(url=url).text
    bodyXML = etree.HTML(res)
    imgList = bodyXML.xpath('//span[@class="bannerfix-wrapper"]/img/@data-src')
    title = bodyXML.xpath('//div[@id="mod-common"]/@data-article-title')
    for item in imgList:
      with open(f'./img/{title}-{random.randint(0,9999)}.jpg',mode='wb') as fs:
            fs.write(requests.get(url='https:'+item).content)
            fs.close()
def mkdir():
    static=os.path.exists('./img')
    if not static:
      os.makedirs('./img')
      return True
    else:
      return False

if __name__ == '__main__':
    mkdir()
    url = input('请输入网址:')
    write(url)
看到QQ看点有漂亮小姐姐,然后就在东拼西凑地找代码片段组合,就写下了以下的代码(大佬绕开)

hitomi666 发表于 2022-7-29 15:16

酒意入桃枝 发表于 2022-7-29 14:53
每次请求时长是多少?会不会被网站注意到认为你是恶意攻击

只采一个文章,不会很多请求,如果可以加上time.sleep(1)

hitomi666 发表于 2022-7-29 18:11

hanzj06 发表于 2022-7-29 16:38
最失败的就是没有放小姐姐的图啊,没图没动力
还有文件名为啥要拼上0-100的随机数啊?

避免文件名重复

酒意入桃枝 发表于 2022-7-29 14:53

每次请求时长是多少?会不会被网站注意到认为你是恶意攻击

gujun0416 发表于 2022-7-29 15:11

感谢楼主分享
共同学习进步

jjyy774447 发表于 2022-7-29 15:12

{:1_908:}小姐姐看多了身体扛不住

怼你个小娘炮 发表于 2022-7-29 15:49

感谢分享!!!!

samz123 发表于 2022-7-29 16:00

QQ看点是什么新东西啊,我找都找不到{:301_1008:}

yuzhiyizhan 发表于 2022-7-29 16:30

牛啊,感谢分享!!!!

纳兰容若 发表于 2022-7-29 16:31

哈哈 小姐姐好看不{:17_1068:}

hanzj06 发表于 2022-7-29 16:38

最失败的就是没有放小姐姐的图啊,没图没动力{:1_926:}
还有文件名为啥要拼上0-100的随机数啊?
页: [1] 2
查看完整版本: python抓取QQ看点小姐姐