吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 1752|回复: 2
收起左侧

[Python 转载] 又来一个奇书小说目录爬取表格查看

[复制链接]
fanvalen 发表于 2020-7-18 00:40
本帖最后由 fanvalen 于 2020-7-18 20:58 编辑

[Python] 纯文本查看 复制代码
#coding=utf-8
import requests
import re
import openpyxl


ld=openpyxl.load_workbook
book=ld("d:\\qishu.xlsx")
sheet1=book["Sheet1"]

hd={'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36'}

p=1
while p<1234:
    url="http://m.iqishu.la/full/"+str(p)+".html"


    try:

        dat=requests.get(url,headers=hd,timeout=60)

    except BaseException:
        dat=requests.get(url,headers=hd,timeout=60)

    if dat.status_code==200:


        with open("d:\\qishu.txt","a+",encoding="utf-8")as f:
            f.write(dat.text)
            f.close()
    else:
        pass

    p=p+1
    print(str(p))




s=open("d:\\qishu.txt",encoding="utf-8").read()




pat=r"<div class=\"full_content\"><p class=\"p1\">(.*?)</p><p class=\"p2\"> <a href=\"(.*?)\" class=\"blue\">(.*?)</a></p><p class=\"p3\"><a>(.*?)</a></p></div>"
r=re.findall(pattern=pat,string=s)




for i in range(len(r)):
    x=r[i]
    print(x)
    row=sheet1.max_row+1
    for b in range(len(x)):
        # print(row)
        sheet1.cell(row,b+1).value=x[b]





book.save("d:\\qishu.xlsx")

ml.jpg
qs.jpg

免费评分

参与人数 1吾爱币 +3 热心值 +1 收起 理由
苏紫方璇 + 3 + 1 欢迎分析讨论交流,吾爱破解论坛有你更精彩!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

 楼主| fanvalen 发表于 2020-7-18 00:57
表格目录下载链接
https://fanvalen.lanzouj.com/i04d8eon9di
春雨忆江南 发表于 2020-7-18 08:01
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-26 03:32

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表