吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 307|回复: 4
收起左侧

[求助] 求一个python捉取全站url的脚本,不包含外站url

[复制链接]
sanen688 发表于 2024-4-25 10:43
如我想要获取https://ruiwen.com 这个站点的所有url,我自己写的脚本爬取url都是只能捉取首页的所有链接,下一页内页的url获取不到。求大佬帮助一下

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

Maiz1888 发表于 2024-4-25 15:51
https://www.ruiwen.com/sitemap.html
 楼主| sanen688 发表于 2024-4-25 16:58
Maiz1888 发表于 2024-4-25 15:51
https://www.ruiwen.com/sitemap.html

只有一点点url链接,不完整,感谢你的帮助
你好,再见 发表于 2024-4-25 21:58
sanen688 发表于 2024-4-25 16:58
只有一点点url链接,不完整,感谢你的帮助

怎么会不完整呢,搜索引擎都是根据sitemap抓取的
chaojiak47 发表于 2024-5-2 14:55
sanen688 发表于 2024-4-25 16:58
只有一点点url链接,不完整,感谢你的帮助

我看挺全的,页码自己加
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-24 14:25

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表