欢迎来到尧图网

客户服务 关于我们

您的位置:首页 > 文旅 > 游戏 > python24-常用的第三方库02:openpyxl模块、pdfplumber模块

python24-常用的第三方库02:openpyxl模块、pdfplumber模块

2025/2/24 18:17:44 来源:https://blog.csdn.net/qq_31532983/article/details/144848564  浏览:    关键词:python24-常用的第三方库02:openpyxl模块、pdfplumber模块

一、openpyxl模块

openpyxl 是一个用于读取和写入 Excel 2010 xlsx/xlsm/xltx/xltm 文件的 Python 库。

它允许你以编程方式操作 Excel 文件,包括创建新的工作簿、修改现有的工作簿、添加或删除工作表、读写单元格数据等。

1-1、安装openpyxl模块

验证:

1-2、openpyxl模块的常用函数

1-3、示例

1-3-1、将数据保存到excel文件中

将上一节的requests模块爬取天气信息的代码封装成函数:

import requests
import re# http请求
def get_html(url):response = requests.get(url)# 设置编码格式response.encoding = 'utf-8'return response.text# 处理http请求的返回结果
def parse_html(html_str):# 正则表达式模式city_pattern = r'<span class="name"><a\s+[^>]*>(.*?)<\/a>'weather_pattern = r'<span class="weather"><a[^>]*>(.*?)</a></span>'wd_pattern = r'<li>.*?<span class="wd">(.*?)</span>.*?</li>'# <span class="zs">适宜</span>zs_pattern = r'<li>.*?<span class="zs">(.*?)</span>.*?</li>'# 搜索匹配项citys = re.findall(city_pattern, html_str)weathers = re.findall(weather_pattern, html_str)wds = re.findall(wd_pattern, html_str)zss = re.findall(zs_pattern, html_str)lst = []for a, b, c, d in zip(citys, weathers, wds, zss):lst.append([a, b, c, d])return lst

将提取到的数据存储到excel中:

1-3-2、从excel文件中读取数据

import openpyxl# 打开工作簿
workbook = openpyxl.load_workbook('景区天气.xlsx')
# 选择要操作的工作表
sheet = workbook['景区天气']#读取表中的内容
lst = []
for row in sheet.rows:sublst = []for cell in row:sublst.append(cell.value)lst.append(sublst)for item in lst:print(item)

1-3-3、注意

  • openpyxl 不支持旧的 Excel 格式(如 .xls。如果你需要处理这种格式的文件,可以考虑使用 xlrd 或 pandas(后者依赖于 xlrd 或 openpyxl 来处理 Excel 文件)。
  • 在处理大型 Excel 文件时,请注意内存使用情况。如果文件非常大,可能需要考虑使用其他工具或方法来处理数据。

二、pdfplumber模块

pdfplumber 是一个用于从 PDF 文件中提取文本、图像和表格的 Python 库。它提供了简单的 API,使得处理 PDF 文件变得更加容易。

2-1、安装pdfplumber模块

pip install pdfplumber

2-2、示例

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com

热搜词