吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 18627|回复: 195
收起左侧

[Python 转载] python妹子图爬虫过验证防封ip[已失效]

    [复制链接]
riwfhiu 发表于 2020-9-19 19:38
本帖最后由 riwfhiu 于 2022-3-4 03:45 编辑

---------------2022-3-4----------------------------------
好久之前的帖子了,官方早就修改了,已失效,原理是安卓模拟器app抓包,requests库发送请求,估计官方早就封掉接口了。
坟帖勿回
-------------------------------------------------------------
最近发现PC端看久了会有一个播放视频的验证,然尔他们的程序员又不设置哪个视频,根本过不去好吗全是模糊一片(我还一度以为是我广告插件拦截了,害~
而且手机端app广告影响体验,关键是要这么多权限干啥子,我怕隐私没了。
查了下论坛,以前的代码都会被反爬虫了,效果不怎么好,脑子里第一个想到用selenium?还是算了吧,那效率太慢了,而且一样没法防验证。

老前辈说过,解决不了问题,就把造成问题的源头给解决了
废话不多说,直接来

70行代码,合适新手学习python爬虫,还有注释,够友好了吧
只使用requests库,(加入urllib3纯粹是为了减少控制台输出Warning的问题,删除掉也无妨)

功能:
1.过防爬虫验证(原理模拟app下载,被封概率少)
2.可调速度,tsleep=0.8,即是0.8秒下载一张(不建议速度太快,别把别人服务器搞坏了)
3.按指定月份下载,自己修改,一下载就是一个月的量,够用了吧,不够的自己加个for循环

4.下载路径可设置,自己打开代码修改


代码

代码


为了防止被别人恶意利用以及方法失效太快,还是我还是用上传附件的形式了
新人求个热心就行,才有动力更新更多好玩的东西

=================================我是分隔线===============================================
09/24:我随便写写发个帖子没想到大家这么热情,考虑到图片不雅,影响大家学习的注意力了,我就不放了,还有小孩子不要看这些,好好学习
另外大家学习python一定要加强身体煅练呀(狗头)
一些小白连怎么打开python都不会,我就简单说一下吧
1.到官网安装python,安装最新的就行:https://www.python.org/
2.安装后再安装依赖库requests:打开cmd输入:pip3 install requests
3.打开python自带的编辑器打开代码按F5运行即可,需要修改年月日期的拉到代码最后修改即可,不想看控制台输出的,注释掉print语句

另外发源码的目的为了激起大家学习的热情,可以把学到的初级for循环,如何调用函数什么的,自己修改一下,
简单实现一下一运行就下载一整年的(真的有手就行,完成之后你会非常有成就感的)
小tips:年月份都是字符串形的,月份必须是2位的字符的,0不能省。
             数字转字符串用str(),小于10的数字转两位字符串的,代码上面已经有例子我就不写了。

mzitu.zip

1.4 KB, 下载次数: 2144, 下载积分: 吾爱币 -1 CB

免费评分

参与人数 76吾爱币 +58 热心值 +67 收起 理由
三百斤的男人 + 1 用心讨论,共获提升!
活在梦里吗X + 1 谢谢@Thanks!
xuanxuanhenbanq + 1 谢谢@Thanks!
hxw0204 + 1 + 1 谢谢@Thanks!
靓丽特 + 1 我很赞同!
a144702137 + 1 用心讨论,共获提升!
xiaohanGG + 1 + 1 谢谢@Thanks!
小肥肥plus + 1 + 1 谢谢@Thanks!
糊涂虫晓晓 + 1 我很赞同!
Lumi_Liz + 1 + 1 谢谢@Thanks!
wasd123456 + 1 + 1 谢谢@Thanks!
rgz + 1 + 1 谢谢@Thanks!
hs2kt0od + 1 谢谢@Thanks!
wu1234 + 1 热心回复!
依旧那个梦影 + 1 我很赞同!
大大大白菜7 + 1 + 1 谢谢@Thanks!
wangchen1043 + 1 热心回复!
风虾雪蟹 + 1 + 1 用心讨论,共获提升!
qzs004 + 1 谢谢@Thanks!
无可厚非垫子 + 1 谢谢@Thanks!
gi204657 + 1 谢谢@Thanks!
落英花 + 1 + 1 我很赞同!
zch1504139 + 1 热心回复!
heiyued + 1 + 1 我很赞同!
死神降临 + 1 谢谢@Thanks!
aut160819 + 1 谢谢@Thanks!
机灵鹤 + 1 + 1 用心讨论,共获提升!
Coptis2020 + 1 谢谢@Thanks!
槿落沉眠 + 1 + 1 谢谢,分享!已食用
zw4218719 + 1 + 1 我很赞同!
jkkl1986 + 1 热心回复!
冷酷到底 + 1 + 1 谢谢@Thanks!
千山暮白雪 + 1 + 1 我很赞同!
sssschnappi + 1 + 1 我很赞同!
yamiga2100 + 1 + 1 谢谢@Thanks!
Natu + 1 + 1 我很赞同!
qq65498198 + 1 + 1 热心回复!
Anekys + 1 + 1 原来所谓的防反爬就是填上协议头和关ssl验证嘛.....
清酒sama + 1 + 1 我很赞同!
青笺画卿颜 + 1 学好python 还得有个好身体啊
小破烂 + 1 + 1 谢谢@Thanks!
nu0l + 1 + 1 热心回复!
疯子猪 + 1 + 1 谢谢@Thanks!
nanhai31 + 1 我很赞同!
ysw295320 + 1 + 1 谢谢@Thanks!
a1231564123 + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
语过 + 1 + 1 保重身体
mirooo1223 + 1 + 1 在学python的路上,一定要加强身体锻炼
joy2 + 1 谢谢@Thanks!只是为了学习
月光下的凡 + 1 谢谢@Thanks!
竹林晓圣 + 1 热心回复!
tuhaojun + 1 + 1 我很赞同!
xiaohanjss + 1 + 1 学习python的路上,一定要加强身体锻炼
zkm2020 + 1 谢谢@Thanks!
gaoxiaoao + 1 学习python的路上,一定要加强身体锻炼
lin_xop + 1 + 1 热心回复!
RexJey + 1 + 1 我是来学习的 (郑重其事)
yjn866y + 1 + 1 热心回复!
wangxd + 1 + 1 怀疑你在开测,又没有证据.....
白晓生 + 1 + 1 谢谢@Thanks!
深水夜藏 + 1 + 1 我很赞同!
你的小猫猫 + 1 热心回复!
安南 + 1 + 1 学习一个
science2011 + 1 + 1 谢谢@Thanks!
sgch007 + 1 + 1 谢谢@Thanks!
0615 + 1 + 1 用心讨论,共获提升!
开车小能手 + 1 我很赞同!
tansty + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
xihua + 1 + 1 妹子图片都好小,做美图录的最好。
yanyyuan + 1 我很赞同!
在线小学生 + 1 + 1 谢谢@Thanks!
keymind + 1 + 1 谢谢@Thanks!
绕天涯 + 1 + 1 谢谢@Thanks!
plwt + 2 + 1 有个视频网站,有兴趣试一下吗
14境左右 + 1 + 1 我很赞同!
dzc999 + 1 + 1 谢谢@Thanks!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

大兵马元帅 发表于 2020-9-19 20:07
我爬了一百多G的图片了,后来发现没用,现在失去乐趣了。。
image.png

免费评分

参与人数 1吾爱币 +1 热心值 +1 收起 理由
136136 + 1 + 1 我有个朋友。。。

查看全部评分

 楼主| riwfhiu 发表于 2020-9-19 20:51
风冯讽凤 发表于 2020-9-19 20:41
不会用啊,大神能打包一下么

百度安装python
再打开cmd输入:
pip3 install requests
然后用python自带的编辑器打开都可以,点击运行就好了,至于修改年月日期什么的,直接接到代码最后几行修改即可。
我发源码的目标是为了给新人学习爬虫,不是单纯发软件的,那样就没有意义了

免费评分

参与人数 5吾爱币 +5 热心值 +4 收起 理由
三百斤的男人 + 1 + 1 用心讨论,共获提升!
海水天天蓝 + 1 + 1 欢迎分析讨论交流,吾爱破解论坛有你更精彩!
zhangyusheng + 1 谢谢@Thanks!
blackgrape + 1 + 1 我很赞同!
风冯讽凤 + 1 + 1 谢谢@Thanks!

查看全部评分

 楼主| riwfhiu 发表于 2020-10-7 16:06
z82190716 发表于 2020-10-7 10:24

获取url:失败!,跳出循环进入下一层
获取url:失败!,跳出循环进入下一层

不是,我只是用穷举法访问而已,失败了不用管,它下载完会自动停的,会有提示语的,如果你不想看到那么多输出,可以#注释掉print语句,不影响结果
miqi1314 发表于 2020-9-19 19:39
支持原创!
14境左右 发表于 2020-9-19 19:51
多谢楼主分享
dzc999 发表于 2020-9-19 19:54

支持原创!
绕天涯 发表于 2020-9-19 19:56
多谢大神,最近正好想学爬虫。
蘅芜 发表于 2020-9-19 20:13
多谢大神
wysyz 发表于 2020-9-19 20:17

多谢大神
冷暖自知丿 发表于 2020-9-19 20:30
可以的支持作者!
在线小学生 发表于 2020-9-19 20:31
大兵马元帅 发表于 2020-9-19 20:07
我爬了一百多G的图片了,后来发现没用,现在失去乐趣了。。。


35万个文件  一秒看一张,除了吃饭睡觉,其它啥也不干,翻一遍估计得一个星期吧,佩服老哥.
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-25 19:54

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表