9. 练习 Q3-Q1
四分位差的计算:
- 先求中位数,将数据分成两个部分。
- 针对分成的两个部分,对每个部分求中位数,得到Q1和Q3.
12. 定义异常值
15. IQR的不足
完全不同的数据集,也有可能有相同的boxplot即箱线图
35. 标准偏差的重要性
标准正态分布,西格玛表示一个标准偏差范围。
38. 贝塞尔校正
在进行 样本sample
选取的时候,通常会选取到居中的值,特别是标准正态分布时,会更加倾向于选取靠近中心的值,这样就会缩小标准偏差,故需要采用贝塞尔校正
,即使用n-1而不是n进行平均值计算。
关于样本sample与总体population:
- your sample is the group of individuals who actually participate in your study.
- your population is the broader group of people to whom you intend to generalize the results of your study.
- Your sample will always be a subset of your population.
练习10,11,12
99. 术语
deviation
:离均差average deviation
:平均偏差variance
:平方偏差standard deviation
:标准差