往期数据分析笔记
【笔记】python数据分析——numpy初识1
【笔记】python数据分析——numpy初识2
【笔记】python数据分析——变换与编程中的轴
【笔记】python数据分析——numpy随机数函数
【笔记】python数据分析——numpy数组索引及切片
【笔记】python数据分析——元素级运算及通用函数
【笔记】python数据分析——条件逻辑运算
统计学运算
今天要说的是统计学运算中要用到的,希望大家能够背下,最低标准也要能够熟练运用
import numpy as np
arr1 = np.random.randint(1,4,(3,3))
print(arr1)
上面的代码就是创建一个三行三列在1-3之间的数,下面所有代码都是以上面为基础来演示
mean(平均值)
print(arr1.mean())
运行结果:
2.3333333333333335
这样就实现了求出这个数组的平均值
sum(求和)
print(arr1.sum())
运行结果:
21
这个就是实现数组求和操作
std(标准差)
print(arr1.std())
运行结果:
0.6666666666666666
标准差公式意义 所有数减去其平均值的平方和,
所得结果除以该组数之个数(或个数减一,即变异数),
再把所得值开根号,所得之数就是这组数据的标准差。
var(方差)
print(arr1.var())
运行结果:
0.4444444444444444
数组中每个值与全体值的平均数之差的平方值的平均数就叫做方差
argmin(最小元素索引)
print(arr1.argmin())
运行结果:
7
意思是索引为7的那个元素值最小
argmax(最大元素索引)
print(arr1.argmax())
运行结果:
1
意思是索引为1的那个元素值最大
cumsum(元素累计和)
print(arr1.cumsum())
运行结果:
[2 5 7 10 12 14 17 18 21]
累计和不是求和,而是后面那个元素是前面全部元素之和
如第一个数就是第一个元素,第二个数就是前两个数之和,第三个数就是前三个数之和
但累计和的最后一个元素的值就是求和sum的值
cumprod(元素累计积)
print(arr1.cumprod())
运行结果:
[ 2 6 12 36 72 144 432 432 1296]
后面那个元素是前面全部元素之积
如第一个数就是第一个元素,第二个数就是前两个数之积,第三个数就是前三个数之积
质的运用
上面说的那些其实我们都可以加上它的质,0质就是横向,1质就是纵向,接下来我举两个栗子
print(arr.mean(axis=0))
运行结果:
[2.66666667 2. 2.33333333]
这个代码的意思就是求出每一个0质(也就是横向)的平均值,结果是浮点型数据
print(arr.cumsum(axis=1))
运行结果:
[[2 5 7]
[3 5 7]
[3 4 7]]
这个代码就是按列累加
今天主要的内容就是大家能够记住这些统计学运算,并且熟练的运用,质不是这里的重点,之前的笔记中我也是记录了质的
今日鸡汤
无论明天是什么样的,后天你总会知道,所以不用那么着急,做好今天就够了。
|