在 Python 中数据可视化在该领域,matplotlib 一直是使用最广泛的可视化库。 然而,其操作的复杂性一直困扰着用户。 为了解决这个问题,seaborn它应运而生,并因其简化的操作流程而受到广泛关注。 尽管如此,seaborn它们的使用方式仍然存在一些缺陷。 经过长达 10 年的抛光,seaborn该团队在 0该更新的第 12 版提出了一种全新的操作模式。 尝试后,我完全被这个新模型所震撼,不想回到旧的使用方式。 在本文中,我们将介绍新版本seaborn。这一次,它是:seaborn0.13版本。
在新模式下,seaborn引入了一种称为“对象”的工作类型接口“操作模式,通过进口seaborn.objects 模块。 在开始之前,我们需要导入数据,这里我用一个咖啡销售数据作为例子。 在开始绘制之前,我们需要做一些配置,以确保图表中的中文不会出现乱码。 接下来,我们可以愉快地开始画画了。
让我们先来看看利润和销售额之间的关系。 由于这两个变量这都是数字,我们可以使用它散布图来代表。 在新模式中,按照可视化图语法的规范,我们首先使用plot() 声明数据和映射,然后在每次调用 add() 方法时使用 add() 方法链接并添加一个新图形。 在 add() 方法中,第一个参数指定了您想要的图形类型,这里我们使用dot() 来表示 “point”。 这样,我们可以很容易地画出散布图
现在,我们希望登上顶峰散布图添加拟合多段线。 在新模式中,每个 add() 方法调用等同于添加新的图表或图层,第一个参数指定模式类型,后续参数用于转换数据。 我们可以这样使用polyfit() 来执行拟合计算。 当然,计算方法可以定制。 使用这种方法,我们可以轻松地将拟合折线添加到图表中。 新模型可能看起来有点复杂,但您会发现它的魅力。
接下来,我们不只是想画画散布图,也希望根据不同地区进行分类展示。 按区域分类意味着我们需要为每个区域分配不同的颜色。 在新模式下,非常简单,只需在**中进行颜色映射即可。 除了颜色之外,还有许多其他属性可以映射,例如我们可以根据毛利润调整点的大小。 通过这种方式,我们可以很容易地配对:散布图进行各种演示。 与旧模式相比,新模式的优势明显,大大减轻了我们的负担。
继续举例说明。 我们可以使用新模型轻松绘制出该地区的销售额直方图。但是,在执行上面的**时,您可能会发现绘图需要很长时间。 同时,绘制的图表有点奇怪。 原因是我们没有在 add() 方法调用中指定聚合方法。 因此,默认情况下,程序将每条线绘制为条形图。 解决这个问题很简单,只需在 add() 方法中指定即可直方图可以聚合。 通过sosoagg() 方法的第一个参数,我们可以指定聚合方法,这是默认的'mean',也可以传递给其他人聚合函数或自定义函数。 这与以下方面有关:pandasagg() 方法的原理是一样的。
接下来,在直方图我们希望按市场类别对显示器进行细分。 即根据不同的市场类别进行颜色映射。 但是,当我们运行上面的**时,结果似乎有些不对劲。 为什么小市场比大市场卖得更多? 让我们分析一下过程以了解结果。 数据反映了 x、y 和 color 这三个字段,以便绘制它们直方图,您需要对 x 和 color 字段进行分组,并均匀地聚合 y 列。 通过sosoagg() 方法,我们可以得到如下聚合结果。 相信经过这个解释,你已经完全理解了新模式的机制,实在是太容易实现了! 你可以再看一些例子来加深你的印象。
当使用新模式时,我们可以向 add() 方法添加无限数量的数据处理函数seaborn还提供了一些常用的数据操作方法供我们选择。 只需根据您的需要选择合适的方法即可。 现在是时候充分利用这些方法了,它们真的非常方便实用。 快来试试吧,你会感受到它的魅力。 别忘了点赞、收藏、关注,这是我创作的最大动力。
在本文中,我们介绍了:seaborn库的新操作模式 - 对象接口。通过引入对象接口seaborn大大简化数据可视化过程。 在新模式中,我们首先通过声明数据和映射来构建图形,然后通过链接 add() 方法逐步添加层。 每层可以指定不同的模式类型,并通过数据处理功能转换数据。 同时,seaborn它提供了丰富的数据操作方式,可以根据需要自由选择。 通过这种方式,我们可以轻松绘制显示多条数据的各种图表尺寸
通过对新模式的学习和实践,我们不仅掌握了:seaborn以及对其背后的原理的深刻理解。 相较于传统的一函数一图表模型,新模型大大简化了我们的使用负担,提高了可视化的效率和灵活性。 通过本文的介绍,希望读者是对的seaborn对新模式有更深入的了解,能够快速上手。