爬娶尤图网美女图片

pwp 发表于 2019-3-20 14:52

本帖最后由 panwanpeng 于 2019-3-20 16:12 编辑

{:1_918:}
import requests
from lxml import etree

headers={
"user-agent":"Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36",
"referer":"https://www.mzitu.com/tag/ugirls/"
}
#1.请求数据
response=requests.get("https://www.mzitu.com/tag/ugirls/",headers=headers)
#2.抽取想要数据
xml=etree.HTML(response.text) #整理成xml文档数据

title_list=xml.xpath('//img[@class="lazy"]/@alt')
src_list=xml.xpath('//img[@class="lazy"]/@data-original')

#4.以图片标题保存图片
for tit,src in zip(title_list,src_list):
   response=requests.get(src,headers=headers)#反爬虫，模拟浏览器提交
   filename="\\"+ tit +".jpg"
   with open(filename,"wb") as f:
            f.write(response.content)

需要安装requests和lxml插件

来张效果图：

补充：这个东西我安装了python 3.7.2 和pycharm，然后用pycharm安装requests和lxml插件，这个不能一步一步讲啊，其实大家搜一下就知道了。

lingkeba 发表于 2019-3-20 15:17

https://www.mzitu.com 这种网站不违规么？》

mychi 发表于 2019-6-11 09:37

fstar22 发表于 2019-3-20 20:51
运行报错,啥也抓不下来,大神看看怎么回事?
Traceback (most recent call last):
File "C:%users\Admin ...

在你程序22行处 with 的写文件应该是请求的信息是空,所以写的时候,没有文件就应该是None 会提示你无效的参数或者是你地址写的有问题 Invalid argument==无效的参数

YT1 发表于 2019-3-20 15:05

什么看不懂

3c666 发表于 2019-3-20 15:10

膜拜一下啊不太懂

cenvin 发表于 2019-3-20 15:10

#3在哪，在哪，在哪呢

燃烧的小毛毛 发表于 2019-3-20 15:14

怎么用啊楼主，纯新手求指导，编程语言！很想学习！

WJJIahUa 发表于 2019-3-20 15:15

会自动分类吗

Zeron0628 发表于 2019-3-20 15:15

怎么使用爬虫代码呢？

蹦蹦兔 发表于 2019-3-20 15:15

没操作方法步骤~只是简单说`,都不知道怎么实现的

a254364502 发表于 2019-3-20 15:18

1195992737 发表于 2019-3-20 15:15
会自动分类吗

送你一个娃娃得了，还要分类、

页: [1] 2 3 4

吾爱破解 - 52pojie.cn's Archiver

爬娶尤图网美女图片