往期数据分析笔记
【笔记】python数据分析——numpy初识1
【笔记】python数据分析——numpy初识2
【笔记】python数据分析——变换与编程中的轴
【笔记】python数据分析——numpy随机数函数
【笔记】python数据分析——numpy数组索引及切片
【笔记】python数据分析——元素级运算及通用函数
【笔记】python数据分析——条件逻辑运算
【笔记】python数据分析——统计学运算
【笔记】python数据分析——矩阵相乘
【笔记】python数据分析——应用案例之图像负片
【笔记】python数据分析——pandas初识
【笔记】python数据分析——pandas之增删查改
【笔记】python数据分析——pandas可视化之线型图
柱状图使用场景
不同类型数据趋势
班级里 男 女
商店里 每个商品的销量
导包
from pandas import Series,DataFrame
import matplotlib as mlp
import matplotlib.pyplot as plt
import numpy as np
每个包是用来干嘛的我上节已经说过了
柱状图
Series柱状图
data=Series(['apple','banana','peach','apple','peach','apple','apple'])
print(data.value_counts())
obj=data.value_counts()
obj.plot(kind='barh')
plt.show()
运行结果:
apple 4
peach 2
banana 1
dtype: int64
运行图:
注意:pandas中的柱状图和线型图区别只在一个kind参数,kind后面的参数是控制图像横竖的,bar是竖向的,barh是横向的
value_counts方法是将数组中不同元素的个数计算出来
DataFrame柱状图
obj=np.random.random_sample(size=(3,3))
print(obj)
data=DataFrame(obj,index=('a','b','c'),columns=('one','two','three'))
data.plot(kind='barh')
plt.show()
运行结果:
[[0.99275815 0.3980906 0.05003522]
[0.96875631 0.41808121 0.57873348]
[0.2508186 0.56143882 0.68572035]]
运行图:
注意:index指的是索引名,columns指的是列名,如果你不指定的话它就会自定义为0,1,2
图表优化
data.plot(kind='bar',stacked=True,alpha=0.5)
plt.show()
运行图:
stacked就是可堆叠的意思,alpha是透明度(0指的是全透明,1指的是原图),图表优化的还有挺多的,但我在这里就介绍这两个,这也是比较常用的两个。
今日鸡汤
在这个羞于谈“梦想”的时代,你还有勇气去追梦吗?