【学习笔记】python 4k写真下载

17798 发表于 2022-4-10 19:42

import requests
import parsel
import os#10692145
url='https://www.yituyu.com/gallery/1069/'
headers={'user-agent': 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)' }
try:
   path=os.getcwd()
   file_path=path+'\\'+'4k写真'
   os.mkdir(file_path)
except:
   pass
x=1069
while(x<2146):
y=1
urls='https://www.yituyu.com/gallery/'+str(x)+'/'
FIRst=requests.get(urls,headers).text
selector=parsel.Selector(FIRst)
url=selector.xpath('//div[@class="gallerypic"]/img/@data-src').getall()
name=selector.xpath('//div[@class="gallerypic"]/img/@alt').get()
for i in url:
   LASt=requests.get(i,headers).content
   with open(f'{file_path}\\{name}'+str(y)+'.jpg','wb')as f:
         f.write(LASt)
         print('正在写入：'+name)
         y+=1
   x+=1

17798 发表于 2022-4-10 19:44

初学python记录一下

atmo 发表于 2022-4-10 21:26

我是来看你扒那个网站的

layuai 发表于 2022-4-10 21:42

又多了一个

jffwoo 发表于 2022-4-10 21:51

对于headers这样的的参数，都是需要修改的吧!希望这样的程序贴上来能加一个这样的注释

zxxwuai 发表于 2022-4-10 22:42

爬爬爬爬爬爬爬爬爬爬爬爬，goodgoodgood

huiker231 发表于 2022-4-10 23:03

atmo 发表于 2022-4-10 21:26
我是来看你扒那个网站的

想到一起了

huiker231 发表于 2022-4-10 23:10

x=1069
while(x<2146):
为什么只爬2146-1069=1077个用户，而不是全面爬

zhuguang123 发表于 2022-4-11 01:17

Python还是好玩

bj9ye666 发表于 2022-4-11 07:00

python是无敌的，真是学会啥都能做

页: [1] 2 3

吾爱破解 - 52pojie.cn's Archiver

【学习笔记】python 4k写真下载