吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 2169|回复: 2
收起左侧

[其他转载] nodejs爬取壁纸类微信公众号文章图片

 关闭 [复制链接]
wusp1994 发表于 2021-11-10 17:10
本帖最后由 wusp1994 于 2021-11-11 11:15 编辑

想实现一个爬虫服务端,可以动态爬取包含,微信公号(壁纸、头像、文案)类的过万阅读的爬虫.

微信公众号文章爬取
话题:话题关键词["头像壁纸控", "头像","壁纸"]
#头像壁纸控 的网页列表链接
decodeURIComponent("url链接")
分析地址
网页URL编码链接
"https://mp.weixin.qq.com/mp/recommendtag?c1=&c2=&tag=%E5%A4%B4%E5%83%8F%E5%A3%81%E7%BA%B8%E6%8E%A7&msg_type=1&__biz=&mid=&idx=&sn=0Xs-nSHbtXlSVh0ivOqW5hjNMRY&ext=HDumE84jvgF82uPDsrG6fizKbvFWoZ0W3YVA33RuZKqMW7hV&cardid=49a86804c72021566ba9590c5082bdb2&exptype=unsubscribed_card_recommend_article_u2i_mainprocess_coarse_sort&tag_type=8&scene=1&subscene=1#wechat_redirect"
网页URL编码-转码后
"https://mp.weixin.qq.com/mp/recommendtag?c1=&c2=&tag=头像壁纸控&msg_type=1&__biz=&mid=&idx=&sn=0Xs-nSHbtXlSVh0ivOqW5hjNMRY&ext=HDumE84jvgF82uPDsrG6fizKbvFWoZ0W3YVA33RuZKqMW7hV&cardid=49a86804c72021566ba9590c5082bdb2&exptype=unsubscribed_card_recommend_article_u2i_mainprocess_coarse_sort&tag_type=8&scene=1&subscene=1#wechat_redirect"
替换关键词即可切换话题

话题页面

话题页面

然后接下来就是使用
superagent作用是获取远程网址html的内容。
cheerio作用是可以通过jQ语法获取页面节点的内容。获取详情页面里面的图片

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

J.Wong 发表于 2021-11-23 16:36
有没有完整代码?
YNNTAFTR 发表于 2022-9-6 15:39
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-25 03:33

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表