17798 发表于 2022-4-10 19:42

【学习笔记】python 4k写真下载

import requests
import parsel
import os#10692145
url='https://www.yituyu.com/gallery/1069/'
headers={'user-agent': 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)' }
try:
      path=os.getcwd()
      file_path=path+'\\'+'4k写真'
      os.mkdir(file_path)
except:
      pass
x=1069
while(x<2146):
    y=1
    urls='https://www.yituyu.com/gallery/'+str(x)+'/'
    FIRst=requests.get(urls,headers).text
    selector=parsel.Selector(FIRst)
    url=selector.xpath('//div[@class="gallerypic"]/img/@data-src').getall()
    name=selector.xpath('//div[@class="gallerypic"]/img/@alt').get()
    for i in url:
      LASt=requests.get(i,headers).content
      with open(f'{file_path}\\{name}'+str(y)+'.jpg','wb')as f:
            f.write(LASt)
            print('正在写入:'+name)
            y+=1
      x+=1   

17798 发表于 2022-4-10 19:44

初学python记录一下

atmo 发表于 2022-4-10 21:26

我是来看你扒那个网站的

layuai 发表于 2022-4-10 21:42

又多了一个

jffwoo 发表于 2022-4-10 21:51

对于headers这样的的参数,都是需要修改的吧!希望这样的程序贴上来能加一个这样的注释

zxxwuai 发表于 2022-4-10 22:42

爬爬爬爬爬爬爬爬爬爬爬爬,goodgoodgood

huiker231 发表于 2022-4-10 23:03

atmo 发表于 2022-4-10 21:26
我是来看你扒那个网站的

想到一起了

huiker231 发表于 2022-4-10 23:10

x=1069
while(x<2146):
为什么只爬2146-1069=1077个用户,而不是全面爬

zhuguang123 发表于 2022-4-11 01:17

Python还是好玩

bj9ye666 发表于 2022-4-11 07:00

python是无敌的,真是学会啥都能做
页: [1] 2 3
查看完整版本: 【学习笔记】python 4k写真下载