Zeaf 发表于 2020-7-4 15:15

【云函数】每日qq群推送最新法律动态(2020.10.11失效)

本帖最后由 Zeaf 于 2020-10-11 19:45 编辑

最近不是云函数挺火么,还有各种大佬分享了各种接口,让吾等狂喜,于是在获得内测资格后马上试了试。
准备:
1.https://qmsg.zendee.cn/进入后注册,按提示加客服获取内测资格(https://qmsg.zendee.cn/api内测资格获取)
2.把机器人拉到自己的群
3.云函数部署代码,触发器设置成每日就行

我的代码参照我原来写的https://www.52pojie.cn/thread-1129116-1-1.html
更改如下:
# -*- coding: utf-8 -*-
"""
Created on Sat Jul4 14:38:47 2020

@author: Zeaf
"""

import requests# 导入requests库
import re# 导入正则表达式库
import time# 导入时间库


user = {
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.116 Safari/537.36'
}
response = requests.get('http://www.pkulaw.cn/cluster_form.aspx?Db=news&menu_item=law&EncodingName=&keyword=%u884C%u653F%u590D%u8BAE%u6CD5&range=name&',headers=user)# 用requests库的get函数访问总网页,用headers进行伪装,获得源码
html = response.text# 用文本显示访问网页得到的内容
urls = re.findall('href="(.*?)" target="_blank"', html)# 用正则表达式获得所有文章网址
#创建空列表用于存储数据
title_in = []
date_in = []
place_in = []
#keyword_in = []
url_in = []
i=1
for url in urls:#循环输出获得的网址
    if i >= 4:#自己可以改,数字越大推送的新闻越多
      break
    time.sleep(1)#暂停1s
    url= 'http://www.pkulaw.cn/'+url#因为爬取得到的网址只是部分,故以此方式填充
    response = requests.get(url,headers=user)# 用requests库的get函数访问总网页,用headers进行伪装,获得源码
    html = response.text# 用文本显示访问网页得到的内容
    title = re.findall('<strong>(.*?)</strong>', html)# 获取标题
    date = re.findall('【发布日期】</font> (.*?)</td>', html) # 获取日期
    place = re.findall('【来源】</font> (.*?)</td>', html) # 获取来源
    #keyword = re.findall('【关键词语】</font> <a href=".*?" target=_blank>(.*?)</a>', html) # 获取关键词,我觉得不太重要就去掉了,要加的话需要改一些地方,下面也得改
    #合并数据
    title_in.append(title)#注意这里title为列表,须先读取后导入,下同
    date_in.append(date)
    place_in.append(place)
    #keyword_in.append(keyword)
    url_in.append(url)
    print('保存中...')
    i+=1
print('保存成功!')

n=1
contents='【今日法治新闻】\n'
for title,date,place,url in zip(title_in,date_in,place_in,url_in):
    content=str(n)+'.'+title+'\n时间:'+date+'\n来源:'+place+'\n原文:'+url
    n+=1
    contents=contents+content+'\n'
url='填入注册获取的api'
msg=contents
qq='填入自己qq群'
data={'msg':msg,'qq':qq}
res=requests.post(url,data=data)
print(res.text)
小试牛刀,快乐开启~

Zeaf 发表于 2020-7-4 15:38

效果图
有啥修改意见可提
基于北大法宝

Zeaf 发表于 2020-7-5 01:10

本帖最后由 Zeaf 于 2020-7-5 01:11 编辑

1225661221 发表于 2020-7-5 00:48
大佬们,把机器人拉到自己的群里以后,接下来怎么搞。。。看不懂呀呀呀呀
机器人没退出去吧
然后把我的代码完善(填上群号和注册后网站给你的接口)
放在云函数里(我用的腾讯云)就可以了
云函数如何部署论坛很多的,你搜一下就有,我这个用python模板就可

Zeaf 发表于 2020-7-4 16:30

我没有失眠啊i 发表于 2020-7-4 16:27
对的我也会去整整试试   pd和np 看了好久学不进去了感觉
这是啥,库么(pandas?)
你加油
我反正学着玩,没压力就是轻松{:1_926:}

无名先森。 发表于 2020-7-4 15:30

可否上一个效果图?

Zeaf 发表于 2020-7-4 15:38

无名先森。 发表于 2020-7-4 15:30
可否上一个效果图?

可看看置顶,已加

浪的一逼 发表于 2020-7-4 16:19

好东西帮顶

我没有失眠啊i 发表于 2020-7-4 16:22

云函数把爬虫的内容推送到qq群里{:301_975:}

Zeaf 发表于 2020-7-4 16:23

我没有失眠啊i 发表于 2020-7-4 16:22
云函数把爬虫的内容推送到qq群里

是这样的,感觉这一条龙可以干很多事

我没有失眠啊i 发表于 2020-7-4 16:27

Zeaf 发表于 2020-7-4 16:23
是这样的,感觉这一条龙可以干很多事

对的 {:301_986:} 我也会去整整试试   pd和np 看了好久 {:301_980:} 学不进去了感觉{:301_972:}

我没有失眠啊i 发表于 2020-7-4 16:31

Zeaf 发表于 2020-7-4 16:30
这是啥,库么(pandas?)
你加油
我反正学着玩,没压力就是轻松

{:301_987:} 我也是学着玩的,毕竟学政治的 {:301_972:}
页: [1] 2 3
查看完整版本: 【云函数】每日qq群推送最新法律动态(2020.10.11失效)