相关分析研究了两个或两个以上随机变量之间的相关关系。与回归分析不同,相关分析侧重于变量之间的相关特征,但这并不意味着变量之间可以相互依赖和预测,如吃冰淇淋和肥胖。
IBM SPSS Statistics可以分析双变量、偏相关性和距离。那么,上述三种相关分析有什么区别呢?让我们通过一些例子来详细解释。
)
双变量相关
顾名思义,双变量相关性研究了两个变量之间的关系,如客流与销售之间的关系。散点图或双变量相关分析方法可用于分析双变量相关性。
例如,从数据的分布来看,图2中显示的客流与销售额之间存在着正相关的关系。
)
双变量相关分析测试了两个变量间相关系数的大小,皮尔逊、肯德尔和斯皮尔曼相关系数可用于SPSS。
)
相关系数r的值在-1和1之间,绝对者越接近1,两个变量之间的相关性就越强。正相关系数表示变量呈正相关,负相关系数表示变量呈负相关。
从本例的分析结果可以看出,销售与客流之间存在着强烈的关系。
)
偏相关
偏相关分析是在变量之间存在共线性的前提下使用的。由于共线性的影响,变量之间可能存在高度的相关性。此时,需要消除共线性变量作为控制变量。
)
例如,在这种情况下,将客户单价作为控制变量,分析销售和客流的偏差。
)
在零阶偏相关分析(相当于两个变量相关分析)中,我们可以看到销售与客流有很强的相关性(相关系数达到0.92)。
在控制客户单价的前提下,销售与客流的相关系数达到0.993,说明相关性很强。
)
距离相关
两个变量之间的相关性和部分相关性是研究变量之间的关系,但距离相关性有点不同,研究变量之间的相似性,即变量之间的关系“亲疏”。
距离相关性可用于研究案例或变量之间的相似性。在这种情况下,我们使用SPSS距离分析来分析购买量、购买量和浏览页面的变量。
)
从距离分析得出的相似矩阵可以看出,购买量与购买量之间存在较高的相似性(值越接近1,越相似)。
)
小结
SPSS相关分析可以进行双变量、偏相关性和距离分析。其中,SPSS双变量研究两个变量之间的关系;偏相关分析研究两个变量之间的关系;距离分析研究变量之间的相似性。