吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 6332|回复: 45
收起左侧

[Python 转载] 一个简单线报爬取,关键词提醒,不用Z8PLUS+了

[复制链接]
不羁的阳光 发表于 2021-7-22 23:45
本帖最后由 不羁的阳光 于 2021-7-23 08:40 编辑

微信图片_20210722234319.png
[Python] 纯文本查看 复制代码
# -*- coding = utf-8 -*-
# [url=home.php?mod=space&uid=238618]@Time[/url] : 2021/7/22 18:55
# Author : Wall.E
# [url=home.php?mod=space&uid=267492]@file[/url] : RIKIPush.py
# [url=home.php?mod=space&uid=371834]@SOFTWARE[/url] : PyCharm
import time
import requests
from lxml import etree
import redis
import random
import winsound
GjKey=['红包','攻略','优惠','首发','大毛','速度','作业','大水','翼支付','有水','白嫖','0元','手慢无']
def log(*args, **kwargs):
    format = '%Y/%m/%d %H:%M:%S'
    value = time.localtime(int(time.time()))
    dt = time.strftime(format, value)
    print(dt, *args, **kwargs)
def getmidstring(html, start_str, end):
    start = html.find(start_str)
    if start >= 0:
        start += len(start_str)
        end = html.find(end, start)
        if end >= 0:
            return html[start:end].strip()
def getrikimsg():

    while True:
        url1 = "https://www.hxm5.com/xianbao/2/"
        headers = {
            "User-Agent": 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36',
        }
        res1 = requests.get(url=url1, headers=headers).text

        tree = etree.HTML(res1)
        tb_list = tree.xpath('//div[1]/ul/li')
        for tb in tb_list[6:]:
            tittle = tb.xpath('./div/h2/a/text()')[0]
            #print(tittle)
            tittle_url = tb.xpath('./div/h2/a/@href')[0]
           # print(tittle_url)
            ex=r.sadd('tids',tittle_url)
            if ex==1:
                url2 = 'https://www.hxm5.com' + tittle_url
                res2 = requests.get(url=url2, headers=headers).text
                tree2 = etree.HTML(res2)
                nr = tree2.xpath('//*[@id="topic-desc"]/p/text()')
                log(tittle+'\n', url2+'\n', nr)
                for GJ in GjKey:
                    if GJ in tittle:
                        winsound.Beep(440, 1500)
                        break
                time.sleep(random.randint(10, 30))
            else:
                log('网站无更新')
                time.sleep(random.randint(30, 90))
                break

if __name__ == '__main__':
    poor = redis.ConnectionPool(host='localhost', port=6379, decode_responses=True)
    r = redis.Redis(connection_pool=poor)
    for key in r.keys():
        r.delete(key)  # 清除所有数据
    getrikimsg()



注意:1,安装PY环境,2,安装REDIS数据库,3,安装那几个第三方库,然后就OK了
        

点评

https://ubuyjia.lanzoui.com/iQ895t8date 试试这个 免费的  发表于 2021-8-27 16:01

免费评分

参与人数 7吾爱币 +6 热心值 +6 收起 理由
Reer + 1 + 1 我很赞同!
supername + 1 热心回复!
lmk136525 + 1 + 1 谢谢@Thanks!
kenk + 1 + 1 我很赞同!
精神科王医生 + 1 + 1 我很赞同!
chen137 + 1 楼主,努力啊,出个视频或者详细的教程啊
iamhrh2 + 1 + 1 打包一个发布

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

 楼主| 不羁的阳光 发表于 2021-7-23 08:37
呆头鹅Two 发表于 2021-7-23 08:29
本来高高兴兴
结果 ####由于目标计算机积极拒绝,无法连接。.
Error 10061 connecting to localhost:6379 ...

你这是没安装redis数据库,下载一个就行了

免费评分

参与人数 1吾爱币 +1 热心值 +1 收起 理由
呆头鹅Two + 1 + 1 谢谢@Thanks!

查看全部评分

 楼主| 不羁的阳光 发表于 2021-7-25 12:46
SuigetsuRe 发表于 2021-7-24 20:23
安装了redis也显示
redis.exceptions.ConnectionError: Error 10061 connecting to localhost:6379. 由于 ...

redis需要安装两个东西,一个是PYthon第三方库,一个是redis软件,你应该没下载软件
 楼主| 不羁的阳光 发表于 2021-7-22 23:47
liushaokai1993 发表于 2021-7-23 00:08
谢谢谢谢谢谢
3404071 发表于 2021-7-23 00:29
对py一窍不通,球球php
ThalesSingapore 发表于 2021-7-23 06:15
可以打包一下吗?
iamhrh2 发表于 2021-7-23 07:57
怎么用啊 。有没有成品现成的或是介绍
E式丶男孩 发表于 2021-7-23 08:20
写的很不错,学习了
呆头鹅Two 发表于 2021-7-23 08:29
本帖最后由 呆头鹅Two 于 2021-7-23 08:31 编辑

本来高高兴兴
结果 ####由于目标计算机积极拒绝,无法连接。.
Error 10061 connecting to localhost:6379. 由于目标计算机积极拒绝,无法连接。.
 楼主| 不羁的阳光 发表于 2021-7-23 08:32
iamhrh2 发表于 2021-7-23 07:57
怎么用啊 。有没有成品现成的或是介绍

安装PY环境,安装那几个第三方库,然后直接保存到PY文件,双击打开就能用了,傻瓜操作
zwgc 发表于 2021-7-23 08:33
谢谢谢谢谢谢
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-25 01:52

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表