因子分析-对商户进行综合评价
虽然系统聚类分析可以对变量进行分类,但是,难以判断变量分类结果的合理性。如果要衡量每个变量对类别的贡献,也难以通过聚类分析来实现。因子分析,就是找出隐藏在变量背后具有共性的因子。
1.1 因子分析简介
因子分析师通过研究变量间的相关系数矩阵,把这些变量间错综复杂的关系归结成少数几个综合因子,并据此对变量进行分类的一种统计分析方法。由于归结出的因子个数少于原始变量的个数,但是它们又包含原始变量的信息,这些因子之间的相关性较低,而因子内部的变量相关程度较高。所以,这一分析过程也称为降维。
(1)因子载荷:就是原始变量和每个因子之间的相关系数,它反映了变量对因子的重要性。
(2)变量共同度:每个变量所包含的信息能够被因子所解释的程度,取值越大,说明该变量能被因子解释的程度越高。
(3)因子选装:对因子载荷矩阵进行旋转,使原始变量和因子之间的关系更加突出,从而对因子的解释更加容易。
(4)因子得分:因子得分可以用来评价每个个案在每个因子上的分值。
因子分析主要有四个步骤:
(1)判断数据是否适合因子分析
(2)构造因子变量
(3)利用因子旋转方法使得因子更具有实际意义
(4)计算每个个案因子的得分
2.因子分析实验
使用SPSS进行因子分析,数据是某公司所属的33个商户O2O运营数据。通过分析它们在一段时间内的线上线下行为信息,以找出这些变量的共性,降低分析维度,并对商户进行综合评价。
实验步骤:【分析】-【降维】-【因子】-【因子分析】
将“网点浏览量”、“论坛浏览量”、“线上广告费用”、“地面推广引入量”、“线下广告费用”、“实体店铺货量”和“实体店访客数”这七个变量移至【变量】框中,作为待分析变量。
图 2-1 【因子分析】参数设置
2-2 【因子分析:描述】对话框
勾选一个【KMO和巴特利特球形度检验】用于生成检验因子分析适合度的统计指标。
图 2-3 【因子分析:提取】对话框
3.因子分析结果解读
第一个输出结果是“KMO和巴特利特检验”,如图 3-1,该结果用来检验数据是否适合因子分析,主要参考KMO统计量即可。如图,KMO统计量为0.627,介于0.5和0.7之间,说明该数据尚可进行因子分析。
图 3-1 因子分析输出结果:KMO和巴特利特检验
第二个输出结果是“公因子方差”,也就是“变量共同度”,该结果显示了原始变量能被提取的因子所表示的程度。如图3-2 所有变量的共同度都在60%以上,可以认为多提取的因子对各变量的解释能力是可以接受的。
图3-2 因子分析:公因子方差
第三个输出结果是“”总方差解释,如图 3-3。一般情况下,累积方差贡献率达到60%及以上,则说明因子对变量的解释能力尚可接受,达到80%及以上,说明因子对变量的解释能力非常好。
图3-3 因子分析输出结果:总方差解释
第四个结果是“碎石图”,如图 3-4 所示,该结果能够辅助我们判断最佳因子个数,通常是选取曲线中较陡的位置所对应的因子个数。
图 3-4 因子分析输出结果:碎石图
从碎石图中可以看出,前三个因子都在教陡的曲线上,所以提取2~3个因子都可以对原始变量的信息有较好的解释。
图 3-5 因子分析输出结果:旋转后的成分矩阵
通过需安装后的椅子载荷矩阵,可以发现:
第一个因子,载荷较大的变量是“网店浏览量”、“论坛浏览量”、“线上广告费用”和“实体店访客数”,说明他们四个变量与该因子的相关程度较高,其中“网店浏览量”、“论坛浏览量”、“线上广告费用”三个变量反映的是线上情况,而“实体店访客数”变量虽然反映的是线下情况,但其载荷值符号为负号,显然,该变量与第一个因子呈反向关系。
综上所述,可将第一个因子命名为“线上商务”因子。
第二个因子,载荷较大的变量是“实体店铺货量”、“线下广告费用”和“地面推广引入量”,说明他们三个变量与该因子的相关程度较高,并且这些变量反映的是线下情况。因此,可以将第二个因子命名为“线下商务”因子。
4.计算因子得分
由前面的计算可得,如图 4-1 “FAC_1”和“FAC_2”这两个变量是每个商户在这两个因子上的得分,柑橘这两个变量旋转载荷平方和的结果的因子贡献率,加权计算,计算综合得分。
图 4-1 因子得分