吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 10869|回复: 28
上一主题 下一主题
收起左侧

[Python 转载] 【GBK游戏小组爬虫 】把GBT的600个游戏下载到本地

  [复制链接]
跳转到指定楼层
楼主
fengoto 发表于 2020-4-8 20:51 回帖奖励
本帖最后由 fengoto 于 2020-4-8 20:56 编辑


想必gbt游戏小组大家都知道吧~
http://renxufeng.ys168.com/
里面的游戏都很好 更新也比较及时  可是想找游戏的时候tm不能搜索啊啊啊!!



最近学习了下python,于是把他爬下来,



代码如下,欢迎指点


[Python] 纯文本查看 复制代码
   
import requests,re,os

def get_game():

    headers = {

        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.163 Safari/537.36'
    }   # 请求头

    res = requests.get("http://cd.ys168.com/f_ht/ajcx/ml.aspx?cz=ml_dq&_dlmc=renxufeng&_dlmm=", headers=headers)

    mls = re.findall('"ml_(.*?)"',res.text)  # 正则表达式获取每个文件 ml_() 括号里面的数字

    for ml in mls:

        params = {
            'cz': 'dq',
            'mlbh': str(ml),  # ml_() 括号里面的数字
            '_dlmc': 'renxufeng',
            '_dlmm': ''
        }

        res_game = requests.get("http://cd.ys168.com/f_ht/ajcx/wj.aspx",headers = headers,params=params)

        title = re.findall('title=".*?">(.*?).torrent</a>',res_game.text) # 游戏文件名字

        game_href = re.findall('<a.*?href="(.*?)"',res_game.text)  # 游戏下载链接

        time = re.findall('<b>(.*?)</b>',res_game.text)   # 游戏发布时间

        game_download(title, game_href, time)   # 调用下载文件函数


def game_download(title, game_href, time):

    for title, game_href, time in zip(title, game_href, time):

        r = requests.get(game_href)   # 请求一下下载链接

        if not os.path.exists("game"):   # 如果当前目录不存在【game】文件夹,则创建

            os.mkdir("game")

        with open("game\%s%s.torrent" % (title, time), "wb") as d:  #下载文件

            d.write(r.content)

            print("正在下载")

get_game()    #执行!!!!!
 
 



如有哪些不足,大佬们希望多多指点 :loveliness:


下载游戏链接 https://www.lanzouj.com/ib4qqli

免费评分

参与人数 11吾爱币 +11 热心值 +8 收起 理由
zhangkof + 1 蓝奏云 链接无法打开!!
onlyimy + 1 + 1 求问这个怎么改成增量式的呀,不然每次都要重新爬取很麻烦
异动的心 + 1 + 1 谢谢@Thanks!
看戏的大k + 1 + 1 热心回复!
吴三岁 + 1 + 1 作者可以的
951240434 + 1 + 1 谢谢@Thanks!
xwl1013 + 1 + 1 谢谢@Thanks!
zbqall + 1 + 1 我很赞同!
siniandd + 1 GBT资源太垃圾乐 没人做种 根本下载不完
zly521 + 1 好东西啊
(ˉ(∞)ˉ)zZ + 1 + 1 谢谢@Thanks!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

推荐
951240434 发表于 2020-4-19 22:17
本帖最后由 951240434 于 2020-4-19 22:18 编辑

没人做种可以用迅雷下载,一旦有人用迅雷下过这个资源,迅雷会保存到他们的服务器,然后会把服务器的那份传给你。什么你问我迅雷会员太贵?唉告诉你个我自己用的租迅雷号的网站吧duxianghao.com

QQ截图20200419221806.png (68.75 KB, 下载次数: 4)

QQ截图20200419221806.png
头像被屏蔽
推荐
泪水的盐 发表于 2020-4-24 14:18
沙发
超音速DX 发表于 2020-4-8 21:01
也就是说改下代码可以爬取永硕网盘所有文件内容?
3#
jswxyl 发表于 2020-4-8 21:09
先收藏了再说
4#
MakeSunshine 发表于 2020-4-8 21:10
是的,GBT好像不支持搜索,但是google search 是可以搜得到的
5#
jiafei5331 发表于 2020-4-8 21:12
这个太赞了
6#
gjp18961105915 发表于 2020-4-8 21:13
随机几个下载了 , 可以下载  谢楼主
7#
HighBox 发表于 2020-4-8 21:16
谢谢楼主
8#
asdone77 发表于 2020-4-8 21:20
试了下效果还不错,谢谢分享现在这种大合集还真难搞
9#
醉乡不怕套路深 发表于 2020-4-8 21:22
建议还是去3dm下载吧,其他的信不过
10#
小鱼在此呵 发表于 2020-4-8 21:26
谢谢楼主分享
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-25 19:00

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表