liyitong 发表于 2023-2-11 15:21

wordpress网站文章的多个目录下载

本帖最后由 liyitong 于 2023-2-11 15:23 编辑


wordpress网站更适合发表博客,自带目录功能。discuz侧更注重于交流,所以回复功能较为丰富,正文区域功能稍弱。
在wordpess模板做的网站上,经常看到一篇文章中自带目录。但是这种目录下,只显示当前章(目录文字会显示浅色)的内容,其余内容需要一个个点击打开新标签页。
如果能把这些目录的超链接保存下来,然后按照顺序去依次访问,并且获取正文内容,存储到文件中,那么就可以一键保存多章节的文章了。
首先写一个函数文件,定义好各个功能:(hanshu.py)


然后写一个主程序函数进行调用zhuchengxu.pyfrom hanshu import get_biaoti, getmulu, get_neirong, get_and_write
import os
url=input('输入网址(多章节选择第一章的地址):\n')
if not os.path.exists("txt_dir"):
    os.makedirs("txt_dir")#新建一个文件夹 txt_dir ,保存文档
biaoti=get_biaoti(url)
print(biaoti)
filename=os.path.join("txt_dir",biaoti)+'.txt'
mulu_list=getmulu(url)
get_and_write(filename, mulu_list )
input('下载完毕,按回车键退出——')

提示有敏感内容,只好发成截图了,不影响看。

cyvakchi 发表于 2023-2-11 21:46

大佬啊,学习一波

a681861 发表于 2023-2-13 09:25

搞图片分享代码也是6

Wisdom_xiaogui 发表于 2023-2-17 11:42

学习一波,感谢分享
页: [1]
查看完整版本: wordpress网站文章的多个目录下载