吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 2954|回复: 8
收起左侧

[Python 原创] 【原创源码】【python】从pdf文档[教育部阅读指导目录]中提取出表格存为excel文件

  [复制链接]
dreamrise 发表于 2021-6-10 08:51
本帖最后由 dreamrise 于 2021-6-10 08:57 编辑

一个从pdf文档中提取出表格数据,并另存为excel文件的python程序

读取的pdf文件来源是:

教育部基础教育课程教材发展中心首次向全国中小学生发布阅读指导目录
http://www.moe.gov.cn/jyb_xwfb/gzdt_gzdt/s5987/202004/t20200422_445605.html
最下面的附件

pdf中按小学、初中、高中推荐了三套生阅读指导目录。
我们根据页码,来分别存为3个EXCEL文件。



[Python] 纯文本查看 复制代码

# -*- coding: utf-8 -*-
import pdfplumber
import pandas as pd

pdf = pdfplumber.open("2020.pdf")

full_df = pd.DataFrame()

for i in range(1, 6):
    second_page = pdf.pages[i]

    table = second_page.extract_table()

    print(table)

    table_df = pd.DataFrame(table[1:], columns=table[0])

    print(table_df)

    full_df = pd.concat([full_df, table_df])

full_df.to_excel('小学段.xlsx')

full_df = pd.DataFrame()

for i in range(6, 11):
    second_page = pdf.pages[i]

    table = second_page.extract_table()

    print(table)

    table_df = pd.DataFrame(table[1:], columns=table[0])

    print(table_df)

    full_df = pd.concat([full_df, table_df])

full_df.to_excel('初中段.xlsx')


full_df = pd.DataFrame()

for i in range(11, 15):
    second_page = pdf.pages[i]

    table = second_page.extract_table()

    print(table)

    table_df = pd.DataFrame(table[1:], columns=table[0])

    print(table_df)

    full_df = pd.concat([full_df, table_df])

full_df.to_excel('高中段.xlsx')



下载链接:
链接: https://pan.baidu.com/s/1k7N1-kTb8e9eBiA7IppBPA 提取码: di3t

未编译exe文件,懒。

免费评分

参与人数 4吾爱币 +6 热心值 +3 收起 理由
苏紫方璇 + 5 + 1 欢迎分析讨论交流,吾爱破解论坛有你更精彩!
yanglinman + 1 谢谢@Thanks!
PhoebeCLS + 1 我很赞同!
yanghui02000 + 1 我很赞同!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

天天涨停天天盈 发表于 2021-6-10 09:42
大佬  功能很实用  但是没有EXE 不会用呀。。。
wujl82 发表于 2021-6-10 09:14
sam喵喵 发表于 2021-6-10 09:42
penglou 发表于 2021-6-10 09:44
谢谢 楼主分享
lihu5841314 发表于 2021-6-10 09:48
  学习了  语法简单  思维流畅
lxyx 发表于 2021-6-10 09:51
天天涨停天天盈 发表于 2021-6-10 09:42
大佬  功能很实用  但是没有EXE 不会用呀。。。

你安装python软件就可以编译了
PhoebeCLS 发表于 2021-6-10 12:36
楼主这个方法值得借鉴啊,真好要下载另一个文档,类似方法成功了
nappywu 发表于 2021-6-22 14:14
很强啊,楼主在哪里呀?
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-25 17:03

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表