名词解释-正态分布

数据可以用不同的方式”分布”

20200525_135604.png 20200525_135610.png 20200525_135615.png

但数据经常会集中在一个中心值的附近,而不向左或右偏斜,叫做 “正态分布”:

20200525_135636.png

通常这就叫做 “钟形曲线”因为曲线的形状像个钟。

20200525_135657.png 20200525_135759.png

统计学里面,正态分布(normal distribution)最常见。男女身高、寿命、血压、考试成绩、测量误差等等,都属于正态分布。

20200525_135849.png

正态分布为什么常见?真正原因是中心极限定理(central limit theorem)

正态分布的主要特征:

  1. 集中性:正态曲线的高峰位于正中央,即均数所在的位置。
  2. 对称性:正态曲线以均数为中心,左右对称,曲线两端永远不与横轴相交。
  3. 均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降。
  4. 正态分布有两个参数,即均数μ和标准差σ,可记作N(μ,σ):均数μ决定正态曲线的中心位置;标准差σ决定正态曲线的陡峭或扁平程度。σ越小,曲线越陡峭;σ越大,曲线越扁平。
  5. u变换:为了便于描述和应用,常将正态变量作数据转换。
20200525_142443.png 20200525_143934.png

有68.2%数值位于平均值1个标准差的范围之内
有95.4%的数值位于2个标准差的范围以内
有99.7%的数值位于3个标准差的范围以内