打造最全皮肤,Python采集英雄联盟(LOL)官网数据!
环境:[*]Python3.6.5
[*]Windows
[*]pycharm
模块:
[*]import requests
[*]import jsonpath from urllib.request
[*]import urlretrieve import os
思路:
完整的源代码:
链接:https://pan.baidu.com/s/1rcAONneAvvRZeSuiAMxppw
提取码:u0n9
复制这段内容后打开百度网盘手机App,操作更方便哦
进入LOL官网的游戏资料-资料库后,可以看到所有的英雄都在里面。
当我们点击英雄头像时,会跳转到皮肤界面。
一般人的做法就是,采集到跳转的url,然后再请求该url获取皮肤数据。
思路没错,但是要想一下,如果源代码中没有跳转的url呢?
elements中确实有该链接,但是源代码中没有:
这个时候,毫无疑问 --抓包吧:
很多人做到这里无从下手了,并没有跳转的url,但是你没发现跳转的url只有一个地方放生了变化吗?(自行观察)
就只有后面的数字发生了变化,而我们的banaudio这个标签当中的url末尾是不是也有个1.ogg???
获取到数字1即可自行构造跳转的url。
到了跳转页面后,会发现网页源代码中同样不存在我们想要的图片数据(继续抓包):
OK,问题已经得到解决,很简单的一个案例。
wszdanywl 发表于 2019-10-10 16:29
这个和以前的盒子一样可以自己改皮肤是吗?慰一下自己!别人都看不到的。
老哥这是爬虫采集所有的皮肤,和英雄联盟改皮肤没关系 厉害啦,讲解很详细,学到了{:1_921:} 看不懂,想学,膜拜一下
看不懂,想学,膜拜一下 感谢一下。 感谢楼主分享 这个和以前的盒子一样可以自己改皮肤是吗?慰一下自己!别人都看不到的。 学到了学到了,谢谢 换肤需谨慎,小撸怡情,大撸封神{:301_999:}
页:
[1]
2