wordpress网站文章的多个目录下载
本帖最后由 liyitong 于 2023-2-11 15:23 编辑wordpress网站更适合发表博客,自带目录功能。discuz侧更注重于交流,所以回复功能较为丰富,正文区域功能稍弱。
在wordpess模板做的网站上,经常看到一篇文章中自带目录。但是这种目录下,只显示当前章(目录文字会显示浅色)的内容,其余内容需要一个个点击打开新标签页。
如果能把这些目录的超链接保存下来,然后按照顺序去依次访问,并且获取正文内容,存储到文件中,那么就可以一键保存多章节的文章了。
首先写一个函数文件,定义好各个功能:(hanshu.py)
然后写一个主程序函数进行调用zhuchengxu.pyfrom hanshu import get_biaoti, getmulu, get_neirong, get_and_write
import os
url=input('输入网址(多章节选择第一章的地址):\n')
if not os.path.exists("txt_dir"):
os.makedirs("txt_dir")#新建一个文件夹 txt_dir ,保存文档
biaoti=get_biaoti(url)
print(biaoti)
filename=os.path.join("txt_dir",biaoti)+'.txt'
mulu_list=getmulu(url)
get_and_write(filename, mulu_list )
input('下载完毕,按回车键退出——')
提示有敏感内容,只好发成截图了,不影响看。 大佬啊,学习一波 搞图片分享代码也是6 学习一波,感谢分享
页:
[1]