扫二维码与项目经理沟通
我们在微信上24小时期待你的声音
解答本文疑问/技术咨询/运营咨询/技术建议/互联网交流
python数据分析常用图大集合:包含折线图、直方图、垂直条形图、水平条形图、饼图、箱线图、热力图、散点图、蜘蛛图、二元变量分布、面积图、六边形图等12种常用可视化数据分析图,后期还会不断的收集整理,请关注更新!
创新互联网站建设公司提供网站设计和自适应建站服务。团队由有经验的网页设计师、程序员和市场专家组成,能够提供从H5响应式网站,网站制作,1元广告,模板建站到微信小程序定制开发等全方位服务。 以客户为中心,致力于为客户提供创新、高效的解决方案,帮助您打造成功的企业网站。
以下默认所有的操作都先导入了numpy、pandas、matplotlib、seaborn
一、折线图
折线图可以用来表示数据随着时间变化的趋势
Matplotlib
plt.plot(x, y)
plt.show()
Seaborn
df = pd.DataFrame({'x': x, 'y': y})
sns.lineplot(x="x", y="y", data=df)
plt.show()
二、直方图
直方图是比较常见的视图,它是把横坐标等分成了一定数量的小区间,然后在每个小区间内用矩形条(bars)展示该区间的数值
Matplotlib
Seaborn
三、垂直条形图
条形图可以帮我们查看类别的特征。在条形图中,长条形的长度表示类别的频数,宽度表示类别。
Matplotlib
Seaborn
1plt.show()
四、水平条形图
五、饼图
六、箱线图
箱线图由五个数值点组成:最大值 (max)、最小值 (min)、中位数 (median) 和上下四分位数 (Q3, Q1)。
可以帮我们分析出数据的差异性、离散程度和异常值等。
Matplotlib
Seaborn
七、热力图
力图,英文叫 heat map,是一种矩阵表示方法,其中矩阵中的元素值用颜色来代表,不同的颜色代表不同大小的值。通过颜色就能直观地知道某个位置上数值的大小。
通过 seaborn 的 heatmap 函数,我们可以观察到不同年份,不同月份的乘客数量变化情况,其中颜色越浅的代表乘客数量越多
八、散点图
散点图的英文叫做 scatter plot,它将两个变量的值显示在二维坐标中,非常适合展示两个变量之间的关系。
Matplotlib
Seaborn
九、蜘蛛图
蜘蛛图是一种显示一对多关系的方法,使一个变量相对于另一个变量的显著性是清晰可见
十、二元变量分布
二元变量分布可以看两个变量之间的关系
十一、面积图
面积图又称区域图,强调数量随时间而变化的程度,也可用于引起人们对总值趋势的注意。
堆积面积图还可以显示部分与整体的关系。折线图和面积图都可以用来帮助我们对趋势进行分析,当数据集有合计关系或者你想要展示局部与整体关系的时候,使用面积图为更好的选择。
十二、六边形图
六边形图将空间中的点聚合成六边形,然后根据六边形内部的值为这些六边形上色。
原文至:
改不了吧。。。。或者说很难?你生成的热力图是用了什么库怎么生成的?还是自己写的?
要把矩形变成六边形,我感觉只能自己写了吧。
我有个想法,那个等边六边形可以拆成上下各三个等边三角形吧。那 这些六边形拼在一起,实际上就是这些等边三角形拼在一起。那就先把各个矩形的值投射到三角形上,在把三角形组合成六边形,求个均值,然后填色
python中可使用seaborn.heatmap画热力图, 官方文档在这
在分类任务中,也可用于画混淆矩阵:
一些参数的含义:
例子:
将最后一行改为,设置最大值和最小值:
设置中心值:
从文件中获取数据,并画图给出有意义的横纵坐标:
将passengers对应的人数标出:
设置方格之间的间隔:
设置使用不同的颜色:
以某个具体的数据为中心:
自动填充坐标值:
不画右边的热度条:
1)打开微信进入应用后点击导航栏【我】,接着点击【钱包】,进入钱包后点击【城市服务】。 2)接着点击【城市热力图】,接着点击上方【搜索栏】。 3)搜索找到你要去的【地方】,就可以查看到该地区的【热力图和提示
热力图的一个常见应用场景是绘制相关系数热力图,数据准备一个相关系数矩阵。
调用 heatmap 方法绘制热力图。
设置 vmin 和 vmax 参数可以调整调色板的下限值和上限值。
设置 cmap 参数,可以修改调色板样式。
设置参数 cbar=False 可以隐藏图例。
设置参数 annot=True 可以显示热力图上的具体数值,设置 fmt 参数,可以修改数值显示的样式。
# Python热力图绘制方法
热力图的使用场景有
1.描述数据在空间的密集程度,常见有城市热力图,区域热力图
2.描述多个变量之间相关性高低程度
# step 1 准备数据集,读取excel列表内容,usecols = index, 这里是表里的第一列不读取。
index =range(1, 11)
dataset = np.array(pd.read_csv(r'C:\Users\Administrator\Desktop\heatmap.csv', usecols=index))
# step 2 读取excel行索引转成列表,作为热力图的y轴标签
a = (pd.read_csv(r'C:\Users\Administrator\Desktop\heatmap.csv', usecols=[0]))
y_label =list(a.stack())
# step 3 读取excel列索引转成列表,作为热力图的x轴标签
b = (pd.read_csv(r'C:\Users\Administrator\Desktop\heatmap.csv'))
column_index=(b.columns.tolist())
x_label = column_index[1:]
# 这一步是为了计算热力图的数据的最大值,可以进行标准化处理,也可以直接显示数据,dataframe转成list,从list里面寻找最大值
dataset_max = (pd.read_csv(r'C:\Users\Administrator\Desktop\heatmap.csv', usecols=index))
list1 = np.array(dataset_max.stack())
max_number =max(list1)
# step 4 开始绘制热力图
plt.figure(figsize=(14, 8))# 定义输出图像大小,annot参数决定是否在热力图上显示数值,Vmax,Vmin表示最大最小值,cmap表示颜色
sns.heatmap(dataset, fmt='.0f', annot=True, vmin=0, vmax=max_number, cmap='Reds', yticklabels=y_label,
xticklabels=x_label)
# 绘制标签
plt.xlabel('This is x label', labelpad=15)
plt.ylabel('This is y label', labelpad=20)
plt.show()
我们在微信上24小时期待你的声音
解答本文疑问/技术咨询/运营咨询/技术建议/互联网交流