欢迎来到尧图网

客户服务 关于我们

您的位置:首页 > 房产 > 家装 > 使用Matplotlib绘制箱线图:详细指南与示例

使用Matplotlib绘制箱线图:详细指南与示例

2024/10/24 2:00:55 来源:https://blog.csdn.net/qq_38844835/article/details/143135154  浏览:    关键词:使用Matplotlib绘制箱线图:详细指南与示例

在数据分析和可视化领域,箱线图(Box Plot)是一种强大的工具,用于展示数据的分布特征,包括中位数、四分位数、异常值等。本文将详细介绍如何使用Matplotlib库在Python中绘制箱线图,并通过一个实际的血压数据集示例来指导读者。

1 箱线图的基本概念

箱线图是一种用于显示一组数据分散情况资料的统计图。它主要用于反映原始数据分布的特征,还可以进行多组数据分布特征的比较。箱线图的绘制方法是:先找出一组数据的上边缘、下边缘、中位数和两个四分位数,然后连接两个四分位数形成箱体,再将上边缘和下边缘与箱体相连接。

2 绘制箱线图的步骤

  1. 准备数据:首先,我们需要准备要绘制的数据。在本文的示例中,我们将使用模拟的血压数据集。
  2. 创建图形和轴对象:使用Matplotlib的subplots函数创建一个图形对象和轴对象。
  3. 绘制箱线图:使用轴对象的boxplot方法绘制箱线图。
  4. 美化图形:通过调整颜色、添加网格线、隐藏边框和设置刻度等方式美化图形。
  5. 保存和展示图形:使用savefig函数保存图形为文件,并使用show函数展示图形。

3 示例代码与解释

以下是一个完整的示例代码,用于绘制血压数据的箱线图:

import matplotlib.pyplot as plt
import numpy as np# 假设这是6组病人血压数据集(这里用随机数据代替实际数据)
bp_data1 = np.random.normal(120, 10, 100)  # 收缩压均值120,标准差10,样本量100
bp_data2 = np.random.normal(130, 15, 100)
bp_data3 = np.random.normal(110, 12, 100)
bp_data4 = np.random.normal(140, 20, 100)
bp_data5 = np.random.normal(100, 8, 100)
bp_data6 = np.random.normal(125, 14, 100)# 将所有数据整合到一个列表中
all_data = [bp_data1, bp_data2, bp_data3, bp_data4, bp_data5, bp_data6]# 设置标签
labels = ['A', 'B', 'C', 'D', 'E', 'F']# 创建一个图形对象和轴对象
fig, ax = plt.subplots(figsize=(12, 6))# 设置全局字体大小
plt.rcParams['font.size'] = 12# 绘制矩形箱线图
bplot = ax.boxplot(all_data,vert=True,  # 箱体垂直对齐patch_artist=True,  # 使用颜色填充labels=labels)  # 设置x轴刻度标签
ax.set_title('Rectangular Box Plot\\n(Blood Pressure Data)')
ax.set_xlabel('Patient Groups')
ax.set_ylabel('Blood Pressure (mmHg)')# 为箱线图设置颜色
colors = ['pink', 'lightblue', 'lightgreen', 'orange', 'purple', 'brown']
for patch, color in zip(bplot['boxes'], colors):patch.set_facecolor(color)# 添加水平网格线
ax.yaxis.grid(True, linestyle='--', alpha=0.7)# 隐藏图形的上边框和右边框
ax.spines['top'].set_visible(False)
ax.spines['right'].set_visible(False)# 设置刻度向内显示
ax.tick_params(axis='both', which='major', direction='in')# 调整布局以避免标签重叠
plt.tight_layout()# 展示图形
plt.show()# 以高分辨率保存图形为PDF文件
plt.savefig("box_plot.pdf", dpi=300)

4 代码解释与美化技巧

  1. 数据准备:我们使用numpy库的random.normal函数生成了六组模拟的血压数据,每组数据包含100个样本。
  2. 图形和轴对象:使用plt.subplots函数创建了一个图形对象和轴对象,并设置了图形的大小。
  3. 绘制箱线图:通过轴对象的boxplot方法绘制了箱线图,并设置了箱体垂直对齐、颜色填充和x轴刻度标签。
  4. 美化图形:我们为箱体设置了不同的颜色,添加了水平网格线,隐藏了图形的上边框和右边框,并将刻度设置为向内显示。这些美化技巧使得图形更加清晰和美观。
  5. 保存和展示图形:使用savefig函数将图形保存为PDF文件,并使用show函数展示图形。

5 总结

本文详细介绍了如何使用Matplotlib库在Python中绘制箱线图,并通过一个实际的血压数据集示例进行了演示。通过本文的学习,读者可以掌握绘制箱线图的基本步骤和美化技巧,并能够在实际的数据分析和可视化工作中灵活应用。希望本文能够对读者有所帮助!

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com