Haste makes waste

Udacity-描述统计学-07-抽样分布

Posted on By lijun

1. 比较样本均值

通过上面的标准正态分布,可以比较某个值在该分布中的位置,如果要比较多个样本之间的差异,可以使用样本的均值等进行比较:

image

3. 期望值

image

6. 样本均值与分布

  • 如下是连续两次后的可能均值:

image

  • 如何分布呢:

image

image

11. 标准偏差之间的关系

image

  • 关系如下:

image

image

12. 中心极限定理

中心极限定理是概率论中的一组定理。中心极限定理说明,在适当的条件下,大量相互独立随机变量的均值经适当标准化后依分布收敛于正态分布。 这组定理是数理统计学和误差分析的理论基础,指出了大量随机变量之和近似服从正态分布的条件。

image

本图描绘了多次抛掷硬币实验中出现正面的平均比率,每次实验均抛掷了大量硬币。

  • 抛100回骰子,每回抛一次骰子,最后得到的是平均分布的图形

image

这是样本标准差与总体标准差相同,因为样本就是1,每回只抛一次骰子

  • 类似,如果每回抛两次骰子,将呈现正态分布

17. 练习:标准误差

image

如上图,每回抛两次骰子,故样本size是2,先求出总体的标准偏差,再根据中心极限定理,求出样本的标准偏差。

另外,样本的均值,与总体的均值相同,都是3.5,与样本的size无关。

18. 5次骰子

image

上图可以看出,样本的size从2变成5,分母变大,标准差变小,分布更窄。

24. M&M CLT

有个48个碟子,每个碟子中装了一包MM糖,一包有很多不同颜色的MM糖,从中选择蓝色的MM糖作为研究对象,48碟中蓝色MM糖的均值是11.25,标准差是3.49. 根据中心极限定理(Central Limit Theorem),每次选择5个碟子,这5个碟子中的蓝色MM糖,重复50次,理论上平均值不变,SE(standard error)为1.56.

image

29. klout抽样分布(标准偏差)

社交影响力的分布图:

image

32. 分布中均值的位置

假设这些人的平均 Klout 分数是 40 分,对于其他样本量为 35 的样本的均值分布,该均值会位于何处? 换句话说,离均值多少个标准偏差?或,Z-值是多少?

image

33. 获得均值的概率

使用Z表格,计算高于40分的概率:

image