搜索
写经验 领红包
 > 时尚

如何判断正态性(判断正态分布的几种方法)

导语:白话统计阅读打卡:用描述的方法判断正态性

如何判断正态性(判断正态分布的几种方法)

当样本量很大的时候,从统计的角度来看几乎永远不可能服从正态分布,所以不少统计学家不建议使用统计检验的方法来判断正态性,而是推荐用图形等描述性方法来进行判断,虽然略带主观性,但是考虑到多数的经典统计方法对“偏态分布”这一问题都是有一定抵抗力的,因此图形判断还是有一定的价值的。

常见的描述正态性的方法主要有以下几种:

Q-Q图和P-P图

也就是分位数-分位数图,在Q-Q图中,横坐标是正态分位数,纵坐标是实际数据的分位数,其思想是比较理论分位数和实际分位数的差距,如果理论分位数和实际分位数没什么差别,那么图中所有的点都应该在一条直线上,如果差别很大就会偏离直线较远。因此Q-Q图判断正态性的原则就是,如果图中的点 大致呈一条从左下至右上的直线,则可以认为是正态性的。

P-P图的思想和Q-Q图差不多,只不过不是用分位数,而是用累计概率,它比较理论上正态分布的累积概率与样本数据的累积概率,其横坐标为理论的累积概率分布,纵坐标为样本数据的累积概率分布,很显然,如果二者吻合,则应该是一条从左下至右上的直线,如果偏离直线较远,则说明样本数据不服从正态分布。

茎叶图

茎叶图用茎和叶分别来描述分布数据的十位数和个位数,并统计出现的频数,根据分布来直观展示数据是否服从正态分布。

利用四分位数间距和标准差进行简易判断

对于一个来自正态分布的样本 ,其四分位数间距和标准差之比大约为1.34,因此一个数据上述的比值如果接近1.34,就可以认为其满足正态分布。

Ref: 《白话统计》冯国双著

本文内容由小滢整理编辑!