全文链接:http://tecdat.cn/?p=26206
原文出处:拓端数据部落公众号
视频:结构方程模型SEM分析心理学营销数据路径图可视化|数据分享
什么是结构方程建模SEM和R语言心理学和营销研究数据路径图可视化
结构方程建模 (SEM) 是一个非常广泛和灵活的数据分析框架,也许更好地被认为是一系列相关的方法,而不是单一的技术。它与营销研究有什么关系?
它的起源可以追溯到 20 世纪之交的心理学家查尔斯·斯皮尔曼和第一次世界大战后的遗传学家 Sewall Wright。许多其他人也参与了它的开发,尤其是 Karl Jöreskog 和 Peter Bentler。协方差结构分析和 LISREL(Jöreskog 共同开发的程序的名称)是偶尔与结构方程建模互换使用的其他术语。
它与营销研究有什么关系?态度、观点和个性特征是消费者行为的重要驱动因素,但它们是潜在的结构,营销研究人员实际上无法观察或直接衡量它们。我们只能根据我们可以观察到的情况来推断它们,例如对问卷项目的回答。测量潜在结构具有挑战性,我们还必须将测量误差的估计纳入我们的模型中。SEM 擅长这两项任务。
简而言之,SEM 同时结合了因子分析和回归,但为建模者提供了比这两种技术中的任何一种都大得多的灵活性。这与运行因子分析然后将因子分数输入多重回归不同。SEM 特别适用于因果分析。此外,当多重共线性(高度相关的自变量)成为一个问题时,SEM 是许多研究人员的首选工具。
SEM 中类似于因子分析的部分称为测量模型,将测量模型的组成部分联系在一起或将它们与一个或多个因变量相关联的元素称为结构模型。然而,有时,在分析之前,变量会根据经验或理论基础进行组合(“打包”),而测量模型则不起作用。在其他时候,我们不关心测量误差,只使用原始变量——SEM 术语中的“观察变量”。当没有测量模型(只有结构模型)时,路径分析这个术语比 SEM 更合适,尽管有些人非常普遍地使用“SEM”。
虽然经常用于分析调查数据,但它不限于任何一种数据源,可以与社交媒体数据、客户交易数据、经济数据一起使用,甚至在神经科学中用于分析 fMRI 数据。在其现代形式中,它能够与任何数据类型一起使用——比率、区间、序数、名义和计数——并且可以对变量之间的曲线关系以及交互作用进行建模。
它不需要完整的数据……它可以容纳多个因变量,有时与联合分析混合。SEM 还可用于调整消费者调查和其他问卷数据中的个人响应风格。
我们什么时候使用它?
想象一下,如果您想更好地了解哪些消费者感知与您的产品或服务类别中的喜欢、购买兴趣或满意度最密切相关,并查看是否存在不同感知的潜在消费者细分(聚类)。虽然不是一个简单的建模任务,但 SEM 将适用于这些目标,并且品牌的图像也可以被映射,以帮助我们了解品牌感知背后的维度如何区分品牌。
SEM 可用于更简单的工作,例如下面关于男性个人护理类别的消费者调查示例。该插图是完整模型的简化和隐藏版本,其中包括更多属性以及年龄等外生变量。我应该注意,除了路径图之外,还有很多输出需要仔细检查!
本次调查中评分的品牌也根据其在完整模型中的因子得分绘制在散点图中。出于保密和篇幅的原因,此处未显示。
几个常见问题解答
我需要多大的样本?多年来引用的两个指南是至少 200 个案例(例如,调查受访者)和每个测量变量至少 10 个案例(例如,如果模型中有 25 个属性评级,则 250 个受访者)。然而,这些指南只是经验法则,现在受到许多质疑。
大数据呢?在过去的 10-15 年里,SEM 才开始迁移到其发源地之外——主要是心理学、社会学和教育学。我记得在美国统计协会杂志上读过一篇文章,向其读者介绍了这种方法。如果我没记错的话,那是在 2006 年,在 SEM 用于社会和行为科学很久之后。在我看来,它在营销研究中仍未得到充分利用,高级分析通常也是如此。
数据科学家现在似乎才开始了解 SEM。这不是一个计算快速的过程,但在今天的硬件上,在具有许多变量的相当大的样本上运行良好。“大”是相对的!在某些情况下,使用标准机器学习工具(例如 LogitBoost 进行预测)和对相同数据样本使用 SEM 来尝试理解生成数据的机制是有意义的 -营销语言中的原因。
我需要做哪些统计假设?这是非常具体的,具体取决于您运行的 SEM 模型的类型。与大多数统计程序一样,SEM 对违反假设非常稳健,一般而言,标准误差比系数估计值更容易受到攻击。
我听说 SEM 只能用于检验假设。这是真的?这是对统计数据的普遍误解,而不仅仅是 SEM。理论不是凭空出现的,而且经常是在观察的基础上发展起来的。简而言之,我们看到事情正在发生,并试图找出它们发生的原因。也就是说,探索性分析——即使你只是使用交叉表——也会带来很高的发现风险,这些发现不会复制或推广到样本或非常狭窄的人群之外。我们总是需要小心并做好功课。
我怎么知道我的模型好不好?为此使用了多种拟合指数。比较拟合指数 (CFI) 和近似均方根误差 (RMSEA) 可能是最常见的。更熟悉的 R 平方有时也能提供丰富的信息。不过,我应该强调,该模型是否“足够好”最终将取决于常识、相关理论和对决策者的潜在效用。在很大程度上,这是一个判断电话。
延伸阅读
网上有大量关于 SEM 的材料,以及关于 SEM 的研讨会和大学课程,或者将其作为主要主题。Barbara M. Byrne 撰写了一些可读性极强的介绍性书籍,重点介绍广泛使用的商业 SEM 统计软件包(例如,使用 EQS 进行结构方程建模)。Rex B. Kline 的畅销书名为 《结构方程建模的原理和实践》,稍微高级一点但也非常易读。
具有潜在变量的结构方程(Bollen) 是揭示 SEM 数学基础的“经典”。如前所述,Stan Mulaik 的结构方程线性因果建模与Bollen 的相似,但更新且更集中于因果分析,这是 SEM 的主要应用。结构方程建模手册 (Hoyle)是一本密集而全面的书,涵盖了所有主要的 SEM 主题。
A Primer on Partial Least Squares Structural Equation Modeling (Hair et al.) 和Causality: Models, Reasoning and Inference (Pearl) 分别介绍了 PLS 和贝叶斯网络,这两种方法被一些研究人员视为 SEM 的替代方法。
良好的心理测量学背景将帮助您充分利用 SEM。心理测量学:导论(Furr 和 Bacharach)和心理测量理论导论(Raykov 和 Marcoulides)是这两本最新的教材,如果您是这门学科的新手,可以帮助您入门。其中第二个比第一个要先进得多。
总结
这是一个强大的工具,从统计学上讲,也是非常危险的。尽管 SEM 在技术上非常复杂,但使用当今用户友好的软件很容易将自己点击进入非常尴尬的情况。
许多模型可能提供与数据相似的拟合,但为决策者提供了截然不同的解释和行动方案。另外,我们需要注意不要过拟合,用SEM很容易做到。
营销研究的一个重要领域介于纯定性研究和艰苦的定量研究之间,而 SEM 在这个灰色空间中特别灵活。
R语言结构方程模型SEM分析心理学和营销研究数据路径图可视化
结构方程建模 (SEM) 是一种全面而灵活的方法,包括在假设模型中研究变量之间的关系,无论它们是测量的还是潜在的,这意味着不可直接观察到,就像任何心理构造(例如,智力、满意度,希望,信任)。因为它是一种多元分析方法,它结合了因子分析的输入以及基于或衍生自多元回归分析方法和规范分析的方法。灵活,因为它不仅可以识别变量之间的直接和间接影响,还可以估计包括潜在变量均值在内的各种复杂模型的参数。
SEM 方法的历史可以追溯到三个不同的传统:(1) 路径分析,最初由遗传学家 Sewall Wright (Wright 1921) 开发,后来在社会学中得到应用 (Duncan 1966),(2) 联立方程模型,如开发经济学博士(Koopmans 1945),以及(3)心理学因素分析(Anderson 和 Rubin 1956)。
应用
基本上,SEM 是一种统计方法,它采用确认(即假设检验)方法来分析与某些现象相关的结构理论。通常,该理论代表了对多个变量产生观察的“因果”过程。术语“结构方程建模”传达了该过程的两个重要方面:(1)所研究的因果过程由一系列结构(即回归)方程表示,以及(2)这些结构关系可以以图形方式建模以便对所研究的理论进行更清晰的概念化。然后可以在对整个变量系统的同时分析中对假设的模型进行统计测试,以确定它与数据的一致性程度。
在 R 中进行 SEM
在 R 环境中,有两种估计结构方程模型的方法。
第一种方法是将 R 与外部商业 SEM 程序连接起来。这在模拟研究中通常很有用,其中使用 SEM 软件拟合模型是模拟管道的一部分。
第二种方法是使用专用的 R 包进行结构方程建模。
为什么是R 包?
这个问题的答案有三个:
使用熔岩
在本节中,我将介绍用于进行 SEM 分析的 R 代码 。
参考
数据获取
在公众号后台回复“营销数据”,可获取完整数据。
本文数据分享到会员群,扫描下面二维码即可加群!
本文摘选《R语言结构方程模型SEM分析心理学和营销研究数据路径图可视化》,点击“阅读原文”获取全文完整资料。
点击标题查阅往期内容
R语言中实现sem进行结构方程建模和路径图可视化
结构方程模型SEM分析心理学和营销研究数据路径图可视化
结构方程模型SEM、路径分析房价和犯罪率数据、预测智力影响因素可视化2案例
结构方程模型 SEM 多元回归和模型诊断分析学生测试成绩数据与可视化
在R语言中实现sem进行结构方程建模和路径图可视化
R语言结构方程SEM中的power analysis 效能检验分析
stata如何处理结构方程模型(SEM)中具有缺失值的协变量
R语言基于协方差的SEM结构方程模型中的拟合指数