吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 29703|回复: 223
收起左侧

[Python 转载] 为了防止女朋友怼我,我就先用python爬了3600个怼人表情包等她来战!

    [复制链接]
创造太阳 发表于 2020-2-29 00:22
感谢大家的关心,女朋友今天不再跟我下五子棋了,(被杀了几十盘还被我指出在什么时候明明有机会赢我),就先睡了!
按照大家的分析,我觉得我很有可能会被怼。(虽然我们之间没有互怼过)!
毛爷爷教导我们:“不打无准备之仗,不打无把握之仗!
所以我就要提前屯点怼人表情包!
谈,大门敞开!
打,奉陪到底!
代码如下(这次就3600个,不算过分吧!):
[Python] 纯文本查看 复制代码
import requests
from lxml import etree



#怼人表情包网址http://www.doutula.com/search?type=photo&more=1&keyword=%E6%80%BC%E4%BA%BA&page=8
#规律一眼就发现是改个数字就行了,就用for i inrange()

for i in range(1,50):    #上次给女朋友发了20000句情话,你们说发的太多,所以这次就爬50页,也就50*72=3600个表情包,打败她应该够了,不够再爬
    url = "http://www.doutula.com/search?type=photo&more=1&keyword=%E6%80%BC%E4%BA%BA&page=" + str(i)    #用数字拼接网址
    res = requests.get(url).text    #用requests.get()函数获得拼接网址的数据
    #print(res)    #打印显示一下
    res_xpath = etree.HTML(res)    #转换为xpath可用的格式
    # 用xpath提取表情包的具体网址
    bqb_urls = res_xpath.xpath('//*[@id="search-result-page"]/div/div/div[2]/div/div[1]/div[1]/div//img/@data-original')
    for bqb_url in bqb_urls:    #依次循环提取表情包网址
        try:
            res = requests.get(bqb_url).content    #获得二进制数据
            file_name = bqb_url.split('/')[-1]    #表情包名字就取网址中的最后一个
            with open (file_name, 'wb') as f:    #用“wb”模式打开,没有就新建,肯定是需要自动新建的
                f.write(res)    #将获得的二进制数据写到文件中
        except:
            pass    #3600个,失败几个无所谓的,不在乎
print("表情包爬取完成,准备战斗吧!")


我就等着她来和我战斗!
好期待啊,这次该让她见识见识我情话攻势之后的怼人表情包攻势!
各位朋友们也可以准备一些,这样就能打败女朋友了!

免费评分

参与人数 72吾爱币 +55 热心值 +57 收起 理由
fangqiezi + 1 + 1 谢谢@Thanks!
yjh0507 + 1 鼓励转贴优秀软件安全工具和文档!
Angle丶xy + 1 + 1 图片储存在哪啊?。?
canfly1414 + 1 + 1 我很赞同!
244261202 + 1 + 1 你这个样子,我不相信你有不用充气的女朋友~~~
xm88 + 1 + 1 代码有了,表情包有了,女朋友要在哪里领?
梧桐777 + 1 + 1 这个代码很好,请问哪里可以找女朋友?
dfh卓越 + 1 + 1 鼓励转贴优秀软件安全工具和文档!
ddklky + 1 + 1 我很赞同!
二馋 + 1 + 1 秀。
lowkeyob + 1 + 1 我很赞同!
tiger1974 + 1 兄弟,醒醒你没女朋友
lbxlwh001 + 1 + 1 我很赞同!
dj1998 + 1 你这个样子,我不相信你有不用充气的女朋友~~~
huang2010 + 1 + 1 你这个样子,我不相信你有不用充气的女朋友~~~
shiyangyanga + 1 + 1 用心讨论,共获提升!
mayaxiaohei + 1 呵呵 如何没有女朋友系列
情感动物洋 + 1 谢谢@Thanks!
WESTARK + 1 + 1 女朋友是充气的咋办!
小佩奇 + 1 我很赞同!
JJLalisa + 1 我很赞同!
cnxinchun + 1 + 1 你这个样子,我不相信你有不用充气的女朋友~~~
mypc1995 + 1 我很赞同!
止戈123 + 1 + 1 兄弟,醒醒你没女朋友
x66 + 1 + 1 bqb_urls = res_xpath.xpath('//*[@id="search-result-page"]//i
201824113144 + 1 + 1 兄弟,醒醒你没女朋友
huojingang + 1 + 1 我很赞同!
553429363 + 1 + 1 真牛逼 收下我的膝盖吧
15603012198 + 1 谢谢@Thanks!
cvil666 + 1 用心讨论,共获提升!
kiviki + 1 我很赞同!
发表的才不 + 1 我很赞同!
七年丶 + 1 + 1 你这个样子,我不相信你有不用充气的女朋友~~~
belie + 1 你这个样子,我不相信你有不用充气的女朋友~~~
zhu1979 + 1 range(1,51)才是50页的吧
guoruihotel + 1 + 1 谢谢@Thanks!
剽完不给钱 + 1 + 1 斗图网没面子的嘛兄弟
hshcompass + 1 + 1 欢迎分析讨论交流,吾爱破解论坛有你更精彩!
ZhouJX1999 + 1 代码了解了,请问女朋友是你发还是国家发呢?
wsdth + 1 + 1 我很赞同!
西地馗熊 + 1 + 1 哈哈哈
unitTK + 1 + 1 你这个样子,我不相信你有不用充气的女朋友~~~
鲁南小轩 + 2 + 1 你这个样子,我不相信你有不用充气的女朋友~~~
wap3364211 + 1 你这个样子,我不相信你有不用充气的女朋友~~~
T_Trojan + 1 你这个样子,我不相信你有不用充气的女朋友~~~
人生没有如果 + 1 我很赞同!
jkxgxy + 1 你这个样子,我不相信你有不用充气的女朋友~~~
mailongxing + 1 你这个样子,我不相信你有不用充气的女朋友~~~
月白mock + 1 + 1 代码有了,表情包有了,女朋友要在哪里领?
www.52pojie.cn + 1 + 1 兄弟,我觉得你充气女朋友都得漏
wasd52030 + 1 + 1 谢谢@Thanks!
cwpcjt + 1 + 1 兄弟,怼赢了,你女友就是别人的拉~~三思
天使之羽 + 1 + 1 我很赞同!
黄焖柠檬 + 1 你 真是个狠人哪,是不是被送医院了
cdtily + 1 + 1 你这个样子,我不相信你有不用充气的女朋友~~~
kk1212 + 1 怼人赢得了胜利,却输了女朋友
yangjie + 1 + 1 我很赞同!
xjiuen444 + 1 怼人赢得了胜利,却输了女朋友,哈哈哈哈哈哈哈哈哈
王钜崟 + 1 你这个样子,我不相信你有不用充气的女朋友~~~
jiajiahui + 1 你这个样子,我不相信你有不用充气的女朋友~~~
ASOKI + 1 你这个样子,我不相信你有不用充气的女朋友~~~
zq7934 + 1 你这个样子,我不相信你有不用充气的女朋友~~~
坂本龙一 + 1 谢谢@Thanks!
小黑啊123 + 1 + 1 我很赞同!
ee789852 + 1 + 1 你这个样子,我不相信你有不用充气的女朋友~~~
DE377DE477 + 1 你这个样子,我不相信你有不用充气的女朋友~~~
九江入海 + 1 你这个样子,我不相信你有不用充气的女朋友~~~
tzxinqing + 1 你这个样子,我不相信你有不用充气的女朋友~~~
木小歌 + 1 你这个样子,我不相信你有不用充气的女朋友~~~
47的小号 + 1 我很赞同!
mkwly + 1 + 1 女拳警告!
bfwl + 1 + 1 代码了解了,请问女朋友是你发还是国家发呢?

查看全部评分

本帖被以下淘专辑推荐:

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

hj185769 发表于 2020-2-29 00:56
楼主又做梦了,你有女朋友???

免费评分

参与人数 2吾爱币 +2 热心值 +2 收起 理由
13877958830 + 1 + 1 我很赞同!
明月过今年 + 1 + 1 热心回复!

查看全部评分

CHANGEWCE 发表于 2020-2-29 00:43
Smilience 发表于 2020-11-25 12:02
创造太阳 发表于 2020-11-25 11:50
这个网站取消了“怼人”的搜索,可以尝试换一下别的关键词。
主要是方法和思路,可以尝试一下其他关键词 ...

找到原因了 打log发现返回的是404 未拿到数据,https请求 我这边模拟浏览器访问可以了
[Python] 纯文本查看 复制代码
import requests,os

from lxml import etree
 
 
 
#怼人表情包网址http://www.doutula.com/search?type=photo&more=1&keyword=%E6%80%BC%E4%BA%BA&page=8
#规律一眼就发现是改个数字就行了,就用for i inrange()
print("正在下载中......")
for i in range(1,50):    #上次给女朋友发了20000句情话,你们说发的太多,所以这次就爬50页,也就50*72=3600个表情包,打败她应该够了,不够再爬
    url = "https://www.doutula.com/search?type=photo&more=1&keyword=怼人&page=" + str(i)    #用数字拼接网址
    headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) '
                         'Chrome/51.0.2704.63 Safari/537.36'}
    savepath="D:\\表情图\\"
    res = requests.get(url=url, headers=headers).text    #用requests.get()函数获得拼接网址的数据
   #  print(res)    #打印显示一下
    res_xpath = etree.HTML(res)    #转换为xpath可用的格式
    # 用xpath提取表情包的具体网址
    bqb_urls = res_xpath.xpath('//*[@id="search-result-page"]/div/div/div[2]/div/div[1]/div[1]/div//img/@data-original')
    for bqb_url in bqb_urls:    #依次循环提取表情包网址
        try:
            res = requests.get(bqb_url).content    #获得二进制数据
            file_name = bqb_url.split('/')[-1]    #表情包名字就取网址中的最后一个
            print(file_name)
            if not os.path.exists(savepath):
                os.makedirs(savepath)
            with open (savepath+file_name, 'wb') as f:    #用“wb”模式打开,没有就新建,肯定是需要自动新建的
                f.write(res)    #将获得的二进制数据写到文件中
               
        except:
            pass    #3600个,失败几个无所谓的,不在乎
    print("第"+str(i)+"页已下载完毕!!!")    
print("表情包爬取完成,准备战斗吧!")
安卓逆向一切 发表于 2020-8-26 14:42
不是,我没懂表情包存哪里了
 楼主| 创造太阳 发表于 2020-3-7 13:34
1ceberg9 发表于 2020-3-7 13:28
bqb_urls = res_xpath.xpath('//*[@id="search-result-page"]/div/div/div[2]/div/div[1]/div[1]/div//img/ ...

审查元素,找到要的信息,右键,复制xpath
小神净 发表于 2020-3-2 16:25
李辉! 发表于 2020-3-1 20:07
我缺一个这样子的女朋友,太难了。太羡慕楼主了

卧槽,五姑娘你也缺。。。。
道冲渊风 发表于 2020-2-29 08:38
女友未至,斗图先行,注孤生的节奏
11833 发表于 2020-2-29 00:56
怼赢了然后呢
bfwl 发表于 2020-2-29 00:42
代码了解了,请问女朋友是你发还是国家发呢
elevenli 发表于 2020-2-29 00:57
可以啊,我也来学习学习
吾爱无爱321 发表于 2020-2-29 01:00
楼主,你醒醒,你没有女朋友
chen556656 发表于 2020-2-29 01:05
狠人,88
hongge 发表于 2020-2-29 01:05
请问女朋友在哪领
alexkillers 发表于 2020-2-29 01:11
醒醒,你和五姑娘在斗图呢
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-22 01:22

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表