爬娶尤图网美女图片
本帖最后由 panwanpeng 于 2019-3-20 16:12 编辑{:1_918:}
import requests
from lxml import etree
headers={
"user-agent":"Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36",
"referer":"https://www.mzitu.com/tag/ugirls/"
}
#1.请求数据
response=requests.get("https://www.mzitu.com/tag/ugirls/",headers=headers)
#2.抽取想要数据
xml=etree.HTML(response.text) #整理成xml文档数据
title_list=xml.xpath('//img[@class="lazy"]/@alt')
src_list=xml.xpath('//img[@class="lazy"]/@data-original')
#4.以图片标题保存图片
for tit,src in zip(title_list,src_list):
response=requests.get(src,headers=headers)#反爬虫,模拟浏览器提交
filename="\\"+ tit +".jpg"
with open(filename,"wb") as f:
f.write(response.content)
需要安装requests和lxml插件
来张效果图:
补充:这个东西我安装了python 3.7.2 和pycharm,然后用pycharm安装requests和lxml插件,这个不能一步一步讲啊,其实大家搜一下就知道了。 https://www.mzitu.com 这种网站不违规么?》 fstar22 发表于 2019-3-20 20:51
运行报错,啥 也抓不下来,大神看看怎么回事?
Traceback (most recent call last):
File "C:%users\Admin ...
在你程序22行处 with 的写文件应该是请求的信息是空,所以写的时候,没有文件就应该是None 会提示你 无效的参数 或者是你地址写的有问题 Invalid argument==无效的参数 什么看不懂 膜拜一下啊不太懂 #3在哪,在哪,在哪呢 怎么用啊楼主,纯新手求指导,编程语言!很想学习! 会自动分类吗 怎么使用爬虫代码呢? 没操作方法 步骤~只是简单说`,都不知道怎么实现的 1195992737 发表于 2019-3-20 15:15
会自动分类吗
送你一个娃娃得了,还要分类、