吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 8193|回复: 36
收起左侧

[原创工具] 【原创】【新人】第一次发帖 获得网站链接的

  [复制链接]
teondy 发表于 2018-10-17 08:55
本帖最后由 teondy 于 2018-10-17 09:03 编辑

爬取吾爱

import urllib.request
import re
def main():
# 循环爬取吾爱的分页内容
    for temp in range(9):
        url = """ https://www.52pojie.cn/forum.php?mod=guide&view=newthread&page=%s """ % temp
        urlopen_data = urllib.request.urlopen(url).read().decode('gbk')  # 获取网页内容

        # <a href="thread-808256-1-1.html" target="_blank" class="xst" >OFFICE2019免激活完全安装,还不来取?</a>

        math = r"""<a href="(.+?.html)" target="_blank" class="xst" >(.+?)</a>"""  # 正则
        findall_url = re.findall(math, urlopen_data)

        # 循环遍历 标题和地址
        for url, temp in findall_url:
            url_all = "%s https://www.52pojie.cn/%s" % (temp, url)
            print(url_all)
    while True:
        cmd = input("请输入exit退出!")
        if cmd == "exit":
            return
if __name__ == '__main__':
    main()



# 以上py源码   


# 软件使用介绍

“”“
以上带代码主要是获得某特定网站的标题和链接的
主要就是没事干 写的
”“”


# 软件的使用   
“”“
可将源码放到pycharm
或直接下载附件中的exe问及那直接运行即可

”“”

# 我是第一次发 具体发贴什么的不了解
# 不好的地方还请谅解

附件中的exe文件运行的状态

附件中的exe文件运行的状态

pycharm运行的状态

pycharm运行的状态

新建文本文档.txt

46 Bytes, 下载次数: 20, 下载积分: 吾爱币 -2 CB

exe文件下载链接

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

xie270112107 发表于 2018-10-17 21:27
错误提示:

Traceback (most recent call last):
  File "C:\Python34\lib\urllib\request.py", line 1183, in do_open
    h.request(req.get_method(), req.selector, req.data, headers)
  File "C:\Python34\lib\http\client.py", line 1137, in request
    self._send_request(method, url, body, headers)
  File "C:\Python34\lib\http\client.py", line 1182, in _send_request
    self.endheaders(body)
  File "C:\Python34\lib\http\client.py", line 1133, in endheaders
    self._send_output(message_body)
  File "C:\Python34\lib\http\client.py", line 963, in _send_output
    self.send(msg)
  File "C:\Python34\lib\http\client.py", line 898, in send
    self.connect()
  File "C:\Python34\lib\http\client.py", line 1287, in connect
    server_hostname=server_hostname)
  File "C:\Python34\lib\ssl.py", line 362, in wrap_socket
    _context=self)
  File "C:\Python34\lib\ssl.py", line 580, in __init__
    self.do_handshake()
  File "C:\Python34\lib\ssl.py", line 807, in do_handshake
    self._sslobj.do_handshake()
ssl.SSLError: [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed (_ssl.c:600)

During handling of the above exception, another exception occurred:

Traceback (most recent call last):
  File "D:\Py\new.py", line 23, in <module>
    main()
  File "D:\Py\new.py", line 7, in main
    urlopen_data = urllib.request.urlopen(url).read().decode('gbk')  # 获取网页内容
  File "C:\Python34\lib\urllib\request.py", line 161, in urlopen
    return opener.open(url, data, timeout)
  File "C:\Python34\lib\urllib\request.py", line 464, in open
    response = self._open(req, data)
  File "C:\Python34\lib\urllib\request.py", line 482, in _open
    '_open', req)
  File "C:\Python34\lib\urllib\request.py", line 442, in _call_chain
    result = func(*args)
  File "C:\Python34\lib\urllib\request.py", line 1226, in https_open
    context=self._context, check_hostname=self._check_hostname)
  File "C:\Python34\lib\urllib\request.py", line 1185, in do_open
    raise URLError(err)
urllib.error.URLError: <urlopen error [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed (_ssl.c:600)>
 楼主| teondy 发表于 2018-10-18 19:49
xie270112107 发表于 2018-10-18 19:06
知道是什么原因了吗 ?  我用另一台电脑正常  ,都是py3.4.4  但这个不知道为什么提示错误

还不太清楚 我是第一次打包成exe文件  我开虚拟机试了也是不行  我也再找  不好意思
鱼先森 发表于 2018-10-17 14:57
吾爱打炮 发表于 2018-10-17 15:48
感谢楼主热心分享
 楼主| teondy 发表于 2018-10-17 21:46
鱼先森 发表于 2018-10-17 14:57
下载后显示无法启动改程序

可能是应为我安装了python环境    我也是第一次发  不好意思  我看看能不能解决
 楼主| teondy 发表于 2018-10-17 21:50
xie270112107 发表于 2018-10-17 21:27
错误提示:

Traceback (most recent call last):

不好意思 我会看看 是怎么回事的  到时候给你回复  
瘦猪 发表于 2018-10-17 22:44
不好意思 我会看看 是怎么回事的  到时候给你回复  
wx13582551210 发表于 2018-10-18 04:29 来自手机
高手啊    楼主
 楼主| teondy 发表于 2018-10-18 08:35

其实我就是一个刚刚学习python的  刚入门 就会点简单的
psxrjdsd 发表于 2018-10-18 08:49
谢谢楼主提供分享啊!~
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-25 23:24

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表