资料统计方法有哪些(统计资料类型)
在生活中,很多人可能想了解和弄清楚白话统计阅读笔记:关于资料类型的思考二的相关问题?那么关于资料统计方法有哪些的答案我来给大家详细解答下。
计数资料可否采用连续资料的方法进行分析
有时人们会认为如果计数资料取值足够多,如咳嗽次数可以取值到几十次,那么此时是否可以采用一般线性模型进行分析。
答案依据实际情况而定,是否采用连续资料的方法取决于研究目的和数据分布。
由于计数资料不能去负数,所以其分布左侧只能截止到0,而连续资料理论上可以取任意值,这一点是两组资料的区别,当计数资料取值多数在0附近时,由于无法取负数,所以这种资料往往表现为偏态分布,从分布的角度来看,不适合作连续资料进行一般线性模型分析。
如果计数资料的取值较远,此时也可能呈现正态分布,但仍旧需要结合研究目的来明确是否能够采用线性模型,如果研究目的预测值不能为负数,那么就不能采用线性回归,所以如果你对预测值有特别要求,就不适合采用线性模型,就只能采用Poisson回归或负二项回归分析。
分类资料中的有序和无序是如何确定的
一般来说两组无序分类资料的比较可采用卡方检验,而有序分类资料的比较可采用秩和检验,但实际中,方法的选择还需要考虑研究目的,比如年龄划分为<40岁、40~50岁、>50岁三组,乍看起来是有序分类资料,但实际上还需要结合研究目的来判定。
比如比较两种药物治疗效果,结局分为进展、不变、好转三种状态,那么目的是想体现出疗效等级的差异,根据这一目的一,必须将结局视为有序分类资料,采用秩和检验,如果采用卡方检验,则体现不出等级的含义,因为在卡方检验中将结局的顺序改变,其结果是不变的。但如果研究目的一本身并不想体现出等级的差异,那么即使资料看起来是有序的,仍可以作为无序分类资料来分析。
连续资料什么时候需要转换为分类资料
如身高体重指数(BMI)是一个连续资料,但是可以根据一定数值将人群分为正常、超重、肥胖等几类,但一般什么时候划分比较合适,对于一个连续变量而言,到底是作为连续资料,还是将其划分为分类资料呢?
这一问题需要结合研究目的,比如出于实际考虑,“BMI每增加1个单位,高血压发生风险就增加1.1%”的说法就不如“肥胖人群与体重正常人群相比,高血压发生风险增加10%”更能让人接受。
此外如果连续资料本身与结果变量之间并不是线性关系,那么有时为了简化问题,可以考虑将其作为分类资料,如探究分析影响高血压的因素示,调查了100名高血压患者 和非高血压患者的年龄、性别等多个指标,在单独分析年龄与高血压的发生事情时,将年龄按<50岁、50~59岁、≥60岁时更能直观地反映出年龄与高血压的发生事情。
Ref:《白话统计》 冯国双著
温馨提示:通过以上关于白话统计阅读笔记:关于资料类型的思考二内容介绍后,相信大家有新的了解,更希望可以对你有所帮助。