【GBK游戏小组爬虫 】把GBT的600个游戏下载到本地
本帖最后由 fengoto 于 2020-4-8 20:56 编辑想必gbt游戏小组大家都知道吧~ http://renxufeng.ys168.com/
里面的游戏都很好 更新也比较及时可是想找游戏的时候tm不能搜索啊啊啊!!
最近学习了下python,于是把他爬下来,
代码如下,欢迎指点
import requests,re,os
def get_game():
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.163 Safari/537.36'
} # 请求头
res = requests.get("http://cd.ys168.com/f_ht/ajcx/ml.aspx?cz=ml_dq&_dlmc=renxufeng&_dlmm=", headers=headers)
mls = re.findall('"ml_(.*?)"',res.text)# 正则表达式获取每个文件 ml_() 括号里面的数字
for ml in mls:
params = {
'cz': 'dq',
'mlbh': str(ml),# ml_() 括号里面的数字
'_dlmc': 'renxufeng',
'_dlmm': ''
}
res_game = requests.get("http://cd.ys168.com/f_ht/ajcx/wj.aspx",headers = headers,params=params)
title = re.findall('title=".*?">(.*?).torrent</a>',res_game.text) # 游戏文件名字
game_href = re.findall('<a.*?href="(.*?)"',res_game.text)# 游戏下载链接
time = re.findall('<b>(.*?)</b>',res_game.text) # 游戏发布时间
game_download(title, game_href, time) # 调用下载文件函数
def game_download(title, game_href, time):
for title, game_href, time in zip(title, game_href, time):
r = requests.get(game_href) # 请求一下下载链接
if not os.path.exists("game"): # 如果当前目录不存在【game】文件夹,则创建
os.mkdir("game")
with open("game\%s%s.torrent" % (title, time), "wb") as d:#下载文件
d.write(r.content)
print("正在下载")
get_game() #执行!!!!!
如有哪些不足,大佬们希望多多指点 :loveliness:
下载游戏链接 https://www.lanzouj.com/ib4qqli
本帖最后由 951240434 于 2020-4-19 22:18 编辑
没人做种可以用迅雷下载,一旦有人用迅雷下过这个资源,迅雷会保存到他们的服务器,然后会把服务器的那份传给你。什么你问我迅雷会员太贵?唉告诉你个我自己用的租迅雷号的网站吧duxianghao.com 也就是说改下代码可以爬取永硕网盘所有文件内容? 先收藏了再说 是的,GBT好像不支持搜索,但是google search 是可以搜得到的 这个太赞了 随机几个下载了 , 可以下载谢楼主 谢谢楼主 试了下效果还不错,谢谢分享现在这种大合集还真难搞 建议还是去3dm下载吧,其他的信不过 谢谢楼主分享