搜索
写经验 领红包
 > 知识

二元logistic回归分析案例(如何做二元logistics回归分析)

导语:二元logit回归案例分析流程

一、案例数据

某同学想要研究大学生是否理财,或者理财情况,并且制订一份问卷,其中包括一些基本信息题目比如:性别、年龄、生活费等。以及还有对理财认知情况、理财现状等等。现在他想利用搜集的数据分析大学生的年龄、性别以及生活费与是否愿意购买理财产品的关系。搜集的部分数据如下:

二、分析问题

其实分析大学生的年龄、性别以及生活费与是否愿意购买理财产品的关系,实际上也就是判断大学生的年龄、性别和生活费对是否愿意购买理财产品的影响,我们可以使用回归分析,因为是否愿意购买理财产品无非就是“是”和“否”为二分类变量,所以在这里我们可以判断,使用的分析模型为二元logit回归。所以以“是否愿意购买理财产品作为因变量”,“年龄”、“性别”以及“生活费”作为自变量进行二元logit回归。分析前需要对数据进行预处理,使数据格式达到分析要求。

三、分析预处理

二元logit回归中的因变量需要满足二分类变量并且只能为0和1,如果因变量不满足要求可以利用SPSSAU中的【数据处理】的【数据编码】进行编码。

因变量

使用SPSSAU数据编码处理如下:

编码后的数据中0代表“否”1代表“是”。

自变量

二元logit回归虽然对于自变量的数据类型没有要求,但是如果自变量是定类变量,理论上是要进行哑变量处理,但是也不是必须的需要结合分析进行处理,由于例子中的“性别”是二分类变量,需要做哑变量处理并且将“性别男”作为参考项进行分析。使用SPSSAU中生成变量的“虚拟哑变量”进行处理,如下:

四、单因素分析

将因变量、自变量处理后,可以进行单因素分析,此步虽然不是必须步骤但是通过此步骤可以初探自变量与因变量之间的关系,如果通过单因素分析发现没有影响,但是后续的回归分析中又发现有影响,那么此时应该检查数据的情况,避免出现其它问题,因为自变量既有定类变量又有定量变量,所以使用不同方法进行分析,由于因变量为二分类变量,所以使用卡方检验和t检验进行分析。

卡方检验

利用卡方检验研究“是否愿意购买”理财产品与“性别”的关系,结果如下:

上表所展示的是卡方检验的结果,可以看到研究中愿意购买理财产品的人占比更大,并且购买理财产品中女生更多占比约为67%,不愿意购买理财产品中男生占比更大,占比约为65%,最后通过卡方检验发现,此次检验中卡方值为52.594,p值远小于0.05呈现显著性,所以说明性别对是否愿意购买理财产品有显著性影响。接下来用t检验研究其它两个变量。

t检验

因为因变量为二分类变量,组别为2,所以使用独立样本t检验,分别研究“是否愿意购买”理财产品与“年龄”和“生活费”之间的关系。

“是否愿意购买”&“年龄”

上表中可以看出不愿意购买理财产品的平均年龄为21岁,购买理财产品的平均年龄为23岁,因为调查的大学生年龄范围为19岁-25岁,所以21岁和23岁差别比较大,通过t检验也发现t值为-15.848,且p值远小于0.05,所以年龄对是否愿意购买理财产品有影响。

“是否愿意购买”&“生活费”

上表中可以看出不愿意购买理财产品的平均生活费约为1312元,愿意购买理财产品的平均生活费约为2026元,差别较大,发现愿意购买理财产品的人生活费更多,通过t检验也发现t值为-38.377,且p值远小于0.05,所以生活费对是否愿意购买理财产品有影响。

五、二元logit结果分析

模型有效性查看

首先查看模型的似然比检验结果,发现p值小于0.05,说明模型总体上有统计学意义,即至少有一个自变量是有预测作用的。以及通过回归分析结果可以看到

回归分析结果

通过上述分析,最后以“是否购买”为因变量,以“性别女”,“生活费”,“年龄”作为自变量进行二元logit回归,并且选择【逐步法】,结果如下:

从上表可知,分析项“性别女”、“年龄”以及“生活费”的p值均小于0.05,意味着均对因变量“是否愿意购买”理财产品均有影响并且回归系数均大于0,均为正向影响。其中“性别女”OR值为4.118意味着女性购买理财产品的意愿为男性样本的4.118倍。其它变量以此类推。除此之外SPSSAU还提供了模型公式和模型预测、Hosmer-Lemeshow拟合度检验等,因为例子主要研究是否有影响,所以这里不在赘述。

六、总结

通过二元logit回归分析大学生的年龄、性别以及生活费与是否愿意购买理财产品的关系。由于二元logit回归对因变量有要求,所以在分析前对因变量进行预处理,以及自变量(定类变量)进行哑变量处理。正式分析前对数据进行单因素分析,目的是初探自变量与因变量之间的关系,发现均均有显著性,接着进行二元logit回归分析发现模型构建有效,并且“性别女”、“年龄”以及“生活费”对因变量均有正向影响的作用,并且例子中女性购买理财产品的意愿为男性样本的4.118倍。分析完毕。

本文内容由小岑整理编辑!