吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 1425|回复: 13
收起左侧

[求助] python 怎么去除重复内容

[复制链接]
____________ 发表于 2022-7-2 21:06
200吾爱币
本帖最后由 ____________ 于 2022-7-2 21:11 编辑

[Python] 纯文本查看 复制代码
import json
import time
import requests
while True:
    url = requests.post("https://api.live.bilibili.com/ajax/msg?roomid=1406726")
    js = json.loads(url.text)
    j=js['data']['room']
    for i in j :
       print(i['nickname'] + "———————" + i['text'] + "———————" + i['timeline'])
       time.sleep(1)

CR`(Y55]~9@ZX3}M32V[6DS.png

想获取直播间聊天记录,但只能获取10个记录,如果没有人发言的话他又会重第一个记录开始获取,我只想获取最新的记录。如果没有新的记录就不打印出来,不知道怎么改写

最佳答案

查看完整内容

下面代码是以发言时间为依据来判断是否已经打印 [mw_shl_code=python,true]import json import requests import time printed_content = set() while True: url = requests.post("https://api.live.bilibili.com/ajax/msg?roomid=1406726") js = json.loads(url.text) j=js['data']['room'] for i in j : if i['timeline'] not in printed_content: printed_content.add(i['timel ...

免费评分

参与人数 1吾爱币 +1 收起 理由
xouou + 1 不管哪个语言, 集合类都有contain方法,直接可以去重

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

grekevin 发表于 2022-7-2 21:06
下面代码是以发言时间为依据来判断是否已经打印

[Python] 纯文本查看 复制代码
import json
import requests
import time

printed_content = set()

while True:
    url = requests.post("https://api.live.bilibili.com/ajax/msg?roomid=1406726")
    js = json.loads(url.text)
    j=js['data']['room']
    for i in j :
       if i['timeline'] not in printed_content:
	       printed_content.add(i['timeline'])
	       print(i['nickname'] + "———————" + i['text'] + "———————" + i['timeline'])
	       time.sleep(1)
grekevin 发表于 2022-7-2 21:19
萌新与小白 发表于 2022-7-2 21:25
我没研究它的接口。只是去重的话,写个判断就行
[Python] 纯文本查看 复制代码
a = ['1', '2', '3']
b = ['4', '2', '3']
for i in b:
    if i not in a:
        print(i)

也可以定义成集合,再往集合中添加数据,因为集合中的数据是唯一的。
最后,你可以看看这里有没有更合适的接口https://github.com/SocialSisterYi/bilibili-API-collect

免费评分

参与人数 1吾爱币 +2 热心值 +1 收起 理由
三滑稽甲苯 + 2 + 1 用心讨论,共获提升!

查看全部评分

ccwuax 发表于 2022-7-2 21:26
你这个可以首先判断时间在哪个时间段以内,其次用in 或 not in 判断是否已经在列表内
kafei000 发表于 2022-7-2 22:38
根据时间来判断是否为新的评论就好了
天真Aro 发表于 2022-7-2 22:39
判断重复continue过滤            
luanshils 发表于 2022-7-3 02:35
set过滤重复



                                            藏起来的小尾巴,不让你看!  
    头像被屏蔽
    wanlinwo 发表于 2022-7-3 08:40
    提示: 作者被禁止或删除 内容自动屏蔽
    狐白本白 发表于 2022-7-3 09:02
    把输出内容存入集合 然后每次判断是否在集合中存在 如果存在则跳过 未存在则存入并输出
    您需要登录后才可以回帖 登录 | 注册[Register]

    本版积分规则

    返回列表

    RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

    GMT+8, 2024-11-25 11:03

    Powered by Discuz!

    Copyright © 2001-2020, Tencent Cloud.

    快速回复 返回顶部 返回列表