吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 13776|回复: 37
上一主题 下一主题
收起左侧

[Python 转载] 爬娶尤图网美女图片

  [复制链接]
跳转到指定楼层
楼主
pwp 发表于 2019-3-20 14:52 回帖奖励
本帖最后由 panwanpeng 于 2019-3-20 16:12 编辑


[Python] 纯文本查看 复制代码
import requests
from lxml import etree

headers={
    "user-agent":"Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36",
    "referer":"https://www.mzitu.com/tag/ugirls/"
}
#1.请求数据
response=requests.get("https://www.mzitu.com/tag/ugirls/",headers=headers)
#2.抽取想要数据
xml=etree.HTML(response.text) #整理成xml文档数据

title_list=xml.xpath('//img[@class="lazy"]/@alt')
src_list=xml.xpath('//img[@class="lazy"]/@data-original')

#4.以图片标题保存图片
for tit,src in zip(title_list,src_list):
        response=requests.get(src,headers=headers)  #反爬虫,模拟浏览器提交
        filename="\\"+ tit +".jpg"
        with open(filename,"wb") as f:
                f.write(response.content)


需要安装requests和lxml插件

来张效果图:



补充:这个东西我安装了python 3.7.2 和pycharm,然后用pycharm安装requests和lxml插件,这个不能一步一步讲啊,其实大家搜一下就知道了。

免费评分

参与人数 5吾爱币 +6 热心值 +4 收起 理由
冥界3大法王 + 1 昨半夜刚看完小甲鱼的爬虫,正好让我实践,感谢~~
全好网 + 1 + 1 热心回复!
dywapj123456 + 1 我很赞同!
cenvin + 1 + 1 我很赞同!
狂暴补师亚丝娜 + 3 + 1 膜拜大佬,爱你哟

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

推荐
lingkeba 发表于 2019-3-20 15:17
https://www.mzitu.com 这种网站不违规么?》
推荐
mychi 发表于 2019-6-11 09:37
fstar22 发表于 2019-3-20 20:51
运行报错,啥 也抓不下来,大神看看怎么回事?
Traceback (most recent call last):
  File "C:%users\Admin ...

在你程序22行处         with 的写文件应该  是请求的信息是空,所以写的时候,没有文件就应该是None 会提示你 无效的参数   或者是你地址写的有问题   Invalid argument  ==无效的参数   
沙发
YT1 发表于 2019-3-20 15:05
3#
3c666 发表于 2019-3-20 15:10
膜拜一下啊  不太懂     
4#
cenvin 发表于 2019-3-20 15:10
#3在哪,在哪,在哪呢
5#
燃烧的小毛毛 发表于 2019-3-20 15:14
怎么用啊楼主,纯新手求指导,编程语言!很想学习!
6#
WJJIahUa 发表于 2019-3-20 15:15
会自动分类吗
7#
Zeron0628 发表于 2019-3-20 15:15
怎么使用爬虫代码呢?
8#
蹦蹦兔 发表于 2019-3-20 15:15
没操作方法 步骤~只是简单说`,都不知道怎么实现的
10#
a254364502 发表于 2019-3-20 15:18

送你一个娃娃得了,还要分类、
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-16 08:01

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表