评估分布形态偏度和峰度的区别(分布的偏度和峰度)
导语:评估分布形态:偏度和峰度
我们可以尝试通过查看直方图来确定经验数据是否表现出模糊的正态分布。但是,我们可能需要其他分析技术来帮助我们确定分布是否足够正常以证明使用参数测试是合理的。
偏度
这些技术之一是计算数据集的偏度。正态分布相对于均值是完全对称的,因此,与完全对称的任何偏差都表示所测量的分布存在一定程度的非正态性。
下图提供了偏斜分布形状的示例。
描绘正偏度,偏度和负偏度。
偏度可以是正数或负数(或零)。相对于平均值对称的分布(例如正态分布)具有零偏度。向右“倾斜”的分布具有负偏度,向左“倾斜”的分布具有正偏度。
作为一般准则,偏斜值在正态分布偏斜度的±1范围内,表示使用参数测试时具有足够的正态性。
峰度
我们使用峰度来量化现象产生值远非均值的趋势。有多种方法可以描述峰度传达的关于数据集的信息:“尾部”(注意,平均值远离分布的尾部),“尾部大小”或“尾部权重”和“峰度”(但是,最后一个有点问题,因为峰度不能直接测量峰度或平坦度)。
正态分布的峰度值为3。下图给出了大于或小于3的峰度与非正态分布形状的对应关系的一般概念。
请注意,峰度大于或小于3对应于非正态分布形状。
橙色曲线是正态分布。请注意,与橙色曲线相比,蓝色曲线具有更大的“尾巴幅度”,即尾部的质量概率更高。蓝色曲线的峰度(称为拉普拉斯分布)为6。绿色曲线的峰度称为均匀分布。您会看到尾巴已被消除。均匀分布的峰度为1.8。
与偏斜一样,一般准则是峰度在正态分布的峰度的±1以内表示足够的正态性。
结论
关于参数测试,偏度和峰度,我们当然还有很多话要说,但是我认为我们已经为介绍性文章涵盖了足够的材料。回顾一下:
当测量结果显示出足够的正态分布时,我们倾向于参数测试。
偏度可量化分布相对于均值的不对称性。
峰度量化了分布的“尾部”,并传达了相应现象产生的值趋于均值之外的趋势。
本文内容由小鸣整理编辑!