吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 1277|回复: 6
收起左侧

[Python 原创] 【菜鸟】用python写的一段过滤谷歌浏览器书签失效的网址

  [复制链接]
cayu52pj 发表于 2023-7-26 11:40
最近刚学习python,属于菜鸟级别的,于是打算写了个简单的书签过滤器,根据request模块请求,删除404的网址
版本:python 3.9
库:request,re

[Python] 纯文本查看 复制代码
# 过滤失效的谷歌浏览器书签
import re
import requests

# 按 Shift+F10 执行或将其替换为您的代码。
# 按 双击 Shift 在所有地方搜索类、文件、工具窗口、操作和设置。

def main_start():
    new_file = open('./整理后的书签文件.html', mode='w', encoding='utf-8')

    new_file2 = open('./失效的书签文件.bed.html', mode='w', encoding='utf-8')
    # 字符匹配
    preg_match = re.compile('A HREF=".*ADD_DATE')

    preg_match_github = re.compile('github')

    filter_html = ''
    bed_html = ''
    with open('./谷歌浏览器导出的书签文件', encoding='utf-8') as bookmark:
        num = 0
        for item in bookmark.readlines():
            if num == 10:
                break
            str_match = preg_match.search(item)
            if str_match != None:
                group_str = str_match.group()
                group_str = group_str.replace('A HREF="', '')
                group_str = group_str.replace('" ADD_DATE', '')
                print(f' 开始请求:{group_str}')
                try:
                    github_search = preg_match_github.search(group_str)
                    if github_search != None:
                        filter_html += item + '\n'
                    else:
                        rr = requests.get(group_str, timeout=5)
                        if rr.status_code == 404:
                            bed_html += group_str + '\n'
                            print(f'{group_str} 这个网址失效啦!')
                        else:
                            filter_html += item + '\n'
                            print(f' 成功响应:{group_str}')
                except:
                    bed_html += group_str + '\n'
                    print(f'except:{group_str} 这个网址失效啦!')
            else:
                filter_html += item + '\n'

        new_file.write(filter_html)
        new_file2.write(bed_html)


# 按间距中的绿色按钮以运行脚本。
if __name__ == '__main__':
    main_start()



免费评分

参与人数 1吾爱币 +7 热心值 +1 收起 理由
苏紫方璇 + 7 + 1 欢迎分析讨论交流,吾爱破解论坛有你更精彩!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

 楼主| cayu52pj 发表于 2023-7-26 19:31
cenyj 发表于 2023-7-26 16:46
大佬python有详细的学习方法么

推荐这书:https://note.youdao.com/s/IsyHNKIQ  入门简单

网上资源挺多的,在于多练习,多写码。 做编程题目,都可以很快入门
sfkj168 发表于 2023-7-26 14:13
elitest 发表于 2023-7-26 15:00
Keran510 发表于 2023-7-26 16:37
感谢大佬分享
 楼主| cayu52pj 发表于 2023-7-26 19:20
谢谢大家,一起学习
 楼主| cayu52pj 发表于 2023-7-31 09:52
Aekainal 发表于 2023-7-27 15:12
也面找不到了诶 显示什么服务器开小差 有木有备用网址嘞

我给个阿里云地址吧: https://www.aliyundrive.com/s/LosHGr9AibL
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-24 21:07

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表