吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 1515|回复: 22
收起左侧

[Python 原创] 看看谁比较能水贴

[复制链接]
liyitong 发表于 2024-1-3 18:27
本帖最后由 苏紫方璇 于 2024-1-3 18:49 编辑

为了用用前两天的小工具:https://www.52pojie.cn/thread-1872336-1-1.html
于是乎,写了这个。用xpath获取用户的帖子数和积分,然后水王指数=帖子数/积分值
因为1个帖子算0.3分,由于存在小数,极限情况就是9个帖子,算2.7分,显示为2,得到水王指数=9/2=4.5
也就是说,这个指数越大,水贴所在积分的比重就越大。帖子数量较大时,这个指数越大(趋近于3.3333),就表示越能水。

[Python] 纯文本查看 复制代码
#wangzhi=https://www.52pojie.cn/home.php?mod=space&uid=1530891&do=profile&from=spaceimport requests
from bs4 import BeautifulSoup as bsp
from lxml import etree
from time import sleep

wangzhi=r"https://www.52pojie.cn/home.php?mod=space&uid=1530890&do=profile&from=space"
tou={"Accept":"text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,*/*;q=0.8",
"Accept-Encoding":"gzip, deflate, br",
"Accept-Language":"zh-CN,zh;q=0.8,zh-TW;q=0.7,zh-HK;q=0.5,en-US;q=0.3,en;q=0.2",
"Connection":"keep-alive",
"Cookie":"",
"Host":"www.52pojie.cn",
"Sec-Fetch-Dest":"document",
"Sec-Fetch-Mode":"navigate",
"Sec-Fetch-Site":"same-origin",
"Sec-Fetch-User":"?1",
"Upgrade-Insecure-Requests":"1",
"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:109.0) Gecko/20100101 Firefox/115.0",
}
for wangzhi in ["https://www.52pojie.cn/home.php?mod=space&uid=%s&do=profile&from=space"%i for i in range(500000,500030)]:
    xy=requests.get(wangzhi, headers=tou)
    et=bsp(xy.text,"lxml")
    html=etree.HTML(xy.text)
    try:
        yonghuming=html.xpath("/html/body/div[7]/div[1]/div/a[2]/text()")
        jifen=html.xpath("/html/body/div[7]/div[4]/div/div[2]/div/div[1]/div[4]/ul/li[2]/text()")
        huitie=html.xpath("/html/body/div[7]/div[4]/div/div[2]/div/div[1]/div[1]/ul[3]/li/a[2]/text()")
        zhuti=html.xpath("/html/body/div[7]/div[4]/div/div[2]/div/div[1]/div[1]/ul[3]/li/a[3]/text()")
        sleep(3)
        yonghuming,jifen,huitie,zhuti=yonghuming[0],int(jifen[0]),int(huitie[0].split(" ")[-1]),int(zhuti[0].split(" ")[-1])
        print(yonghuming,"水王指数:%.2f"%((zhuti+huitie)/jifen) )
    except Exception as res:
        "用户已被注销或者清理"
    finally:
        '52 pojie'

爬取uid=498888到498988的100名用户,去掉已经被封号的,结果如下:
飞LOVEping 水王指数:0.89
957320193 水王指数:3.23
花自飘零 水王指数:3.35
like_520 水王指数:0.52
forrest888888 水王指数:1.77
wukang 水王指数:1.88
howlongtheid 水王指数:3.18
zhangquan 水王指数:3.60
wu601938170 水王指数:4.00
mash2016 水王指数:3.60
scucqu 水王指数:3.40
273131867 水王指数:3.24

好吧,爬不动了,论坛不让爬

免费评分

参与人数 2吾爱币 +7 热心值 +2 收起 理由
苏紫方璇 + 7 + 1 欢迎分析讨论交流,吾爱破解论坛有你更精彩!
yanjia5286 + 1 鼓励转贴优秀软件安全工具和文档!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

苏紫方璇 发表于 2024-1-3 18:51
为了您的账号安全,帮您给cookie编辑掉了,建议修改一下密码,这样原来透漏的cookie就失效了

免费评分

参与人数 1吾爱币 +1 热心值 +1 收起 理由
liyitong + 1 + 1 谢谢@Thanks!

查看全部评分

Mzxr 发表于 2024-1-3 18:43
你是怎么敢把自己的cookie给放出来的?

免费评分

参与人数 1吾爱币 +1 收起 理由
liyitong + 1 我相信大家都是好人

查看全部评分

大兵马元帅 发表于 2024-1-3 19:06
Mzxr 发表于 2024-1-3 18:43
你是怎么敢把自己的cookie给放出来的?

python天下无敌,爬虫爬习惯了,哈哈
restart19 发表于 2024-1-3 19:17
两天前刚在b站看到有人使用xpath爬去哪儿网站数据
dtsuifeng 发表于 2024-1-3 19:21
牛人,搞了论坛还是这里声明。
LuckyClover 发表于 2024-1-3 20:29
牛了,把自己的cookie给放出来哈哈哈
acntbbs 发表于 2024-1-3 20:46
怎么聊天最水,这是个问题,这个问题比较难说,啊
woflant 发表于 2024-1-3 21:26
拿论坛练手,这个可以

小心访问频繁被ban哦
TL1ng 发表于 2024-1-3 22:46
很棒的思路,我也去实践实践
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-24 15:24

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表