pwp 发表于 2019-3-20 14:52

爬娶尤图网美女图片

本帖最后由 panwanpeng 于 2019-3-20 16:12 编辑

{:1_918:}
import requests
from lxml import etree

headers={
    "user-agent":"Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36",
    "referer":"https://www.mzitu.com/tag/ugirls/"
}
#1.请求数据
response=requests.get("https://www.mzitu.com/tag/ugirls/",headers=headers)
#2.抽取想要数据
xml=etree.HTML(response.text) #整理成xml文档数据

title_list=xml.xpath('//img[@class="lazy"]/@alt')
src_list=xml.xpath('//img[@class="lazy"]/@data-original')

#4.以图片标题保存图片
for tit,src in zip(title_list,src_list):
      response=requests.get(src,headers=headers)#反爬虫,模拟浏览器提交
      filename="\\"+ tit +".jpg"
      with open(filename,"wb") as f:
                f.write(response.content)

需要安装requests和lxml插件

来张效果图:



补充:这个东西我安装了python 3.7.2 和pycharm,然后用pycharm安装requests和lxml插件,这个不能一步一步讲啊,其实大家搜一下就知道了。

lingkeba 发表于 2019-3-20 15:17

https://www.mzitu.com 这种网站不违规么?》

mychi 发表于 2019-6-11 09:37

fstar22 发表于 2019-3-20 20:51
运行报错,啥 也抓不下来,大神看看怎么回事?
Traceback (most recent call last):
File "C:%users\Admin ...

在你程序22行处         with 的写文件应该是请求的信息是空,所以写的时候,没有文件就应该是None 会提示你 无效的参数   或者是你地址写的有问题   Invalid argument==无效的参数   

YT1 发表于 2019-3-20 15:05

什么看不懂

3c666 发表于 2019-3-20 15:10

膜拜一下啊不太懂   

cenvin 发表于 2019-3-20 15:10

#3在哪,在哪,在哪呢

燃烧的小毛毛 发表于 2019-3-20 15:14

怎么用啊楼主,纯新手求指导,编程语言!很想学习!

WJJIahUa 发表于 2019-3-20 15:15

会自动分类吗

Zeron0628 发表于 2019-3-20 15:15

怎么使用爬虫代码呢?

蹦蹦兔 发表于 2019-3-20 15:15

没操作方法 步骤~只是简单说`,都不知道怎么实现的

a254364502 发表于 2019-3-20 15:18

1195992737 发表于 2019-3-20 15:15
会自动分类吗

送你一个娃娃得了,还要分类、
页: [1] 2 3 4
查看完整版本: 爬娶尤图网美女图片