安装库

1
2
pip install pypdf2
pip install pdfplumber

提取文字

1
2
3
4
5
# 提取pdf文字
with pdfplumber.open("D:\\pdffiles\\Python编码规范中文版.pdf") as pdf:
page01 = pdf.pages[0] #指定页码
text = page01.extract_text()#提取文本
print(text)

提取表格

1
2
3
4
5
with pdfplumber.open("D:\\pdffiles\\人力资源部岗位编制.pdf") as pdf:
page01 = pdf.pages[0] #指定页码
table1 = page01.extract_table()#提取单个表格
# table2 = page01.extract_tables()#提取多个表格
print(table1)