肥宅钓鱼网
当前位置: 首页 钓鱼百科

spss单个因素数据分析(SPSSAU数据分析)

时间:2023-08-15 作者: 小编 阅读量: 1 栏目名: 钓鱼百科

通常情况下如果得票率大于50%即会获选,反之小于50%则会落选。结果变量Y为联邦支出。第五步、模型稳健性检验模型分析后,还需要对模型稳健性进行检验。即意味着应该使用精确断点。并且有时候控制变量并不能被当前断点cutoff值区分为两侧因而不能进行分析,本案例即是此类情况,本案例不进行‘局部平滑性检验’。因而进行操作,准备得到最终结果。

断点回归是一种‘准自然实验’式研究,其思想在于存在一个连续变量(驱动变量X,或分组变量,或处理变量),该变量某临界点cutoff处可拆分成左侧和右侧,进而研究该变量对于另一变量(结果变量Y,或因变量)的影响。比如高考时本科线为500分,那么有的学生好低于500分,有的弱高于500,但正是由于500这个cutoff断点值,导致学生是否能上本科,进而最终影响到学生以后的收入情况,此处高考成绩即为驱动变量X,收入则为结果变量Y。

上述的500分是一个非常明确的断点cutoff值,如果低于500分一定不能上本科,高于500分一定可以上本科,那么此类RDD模型则称为‘精确断点’(sharpregression discontinuity design,简称SRD)。如果说有的学生有着‘特长加分项’,分数小于500分但正由于其有着‘特长加分项’因而上了本科,也或者有的学生高于500分但是其更愿意读了优秀的专科,此类情况时的断点回归研究,称作为‘模糊断点回归’(fuzzyregression discontinuity,简称FRD),多数情况下研究均使用精确断点SRD;除此之外,RDD断点回归模型时有时还会加入到控制变量。上述涉及几个关键术语,汇总如下表:

背景

一般来讲美国民主党更倾向于更多的联邦支出,案例研究是否民主党获选对于联邦支出的影响。通常情况下如果得票率大于50%即会获选,反之小于50%则会落选。因而得票率则为驱动变量X,此处0.5则可作为断点cutoff值(研究中为了方便使用,因而将得票率–0.5)作为驱动变量,即最终cutoff值为0,大于0则应该获选,小于0则应该落选)。结果变量Y为联邦支出。而且还包括另外2个控制变量。除此之外,还包括另外一个变量‘是否获选’作为判断是否模糊断点。本案例数据使用Stata软件的votex.sta数据,各数据的定义如下:

理论

RDD断点回归的分析知识点相对较多,从分析步骤包括,具体可精确断点或模糊断点的选择,模型选择,模型基本假定分析,模型分析,模型稳健性检验等。具体分为以下5步。

第一步、精确断点和模糊断点判断

判断精确断点或模糊断点的思路在于处理变量X被cutoff分为左右两侧后,是否真正决定‘实验走向’,比如本案例中cutoff值分成两组后即认为‘民主党是否当选’(命名为new_x),而fuzzy模糊项即真实是否当选项,如果与new_x与fuzzy项没有特别明显的不一致,甚至完全一样,此时则应该使用精确断点。反之如果new_x与fuzzy项有着明显的差异,此时使用模糊断点较为适合。

第二步、模型选择,通常指模型阶数的判断

研究X对于Y的影响时,二者的关系是线性关系(一阶),还是曲线二阶关系,也或者三阶关系。可首先通过图示直观查看,并且得出结论。待定模型阶数后,后续分析基于该阶数进行分析使用。至于‘带宽值’或者‘核函数’,通常默认即可,SPSSAU会自动找出最优带宽值,默认使用triangular三角核函数。

第三步、模型基本假定分析

RDD模型通常包括着一定的假设,通常包括‘断点适用性检验’和‘局部平滑性检验’。如下所述:

第四步、模型分析

在上述确认好精确或模糊断点,并且确定好模型阶数,并且模型适合时,则开始分析X对于Y的影响关系情况。

第五步、模型稳健性检验

模型分析后,还需要对模型稳健性进行检验。模型稳健性检验有多种方式,包括更换核函数法、更换断点值法,是否加入控制变量法,更换带宽值法,更换阶数,改变样本选择法,如下表格所述。

操作

第一步、精确断点和模糊断点判断

将X按cutoff值0分为两组,并且与fuzzy项进行交叉卡方分析。操作截图分别如下:

使用SPSSAU数据处理->数据编码功能,并且选择‘范围编码’,将x按cutoff值0分为两组(可通过描述分析得到x的最小值为-0.276,最大值0.470)。系统会自动生成一个新标题‘New_x’,将该项与fuzzy项进行交叉卡方,得到如下结果:

New_x代表x分为两组后的新变量,0代表cutoff值左侧(落选),1代表cutoff值右侧(当选)。而fuzzy项里面的0和1代表真实情况下‘是否当选’(0为落选,1为当选)。从上表格可以看到:二者数据完全一致,按cutoff值得到的131个‘落选’样本真实情况下也是‘落选’,按cutoff值得到的218个‘当选’样本真实情况下也是‘当选’。即意味着应该使用精确断点。

提示:

实际研究中,如果数据的gap较小,此时也可直接使用精确断点回归。

确认好为精确断点模型之后,接着进行第二步。

第二步、模型阶数判断

模型阶数判断时使用直观图示法。即首先进行模型分析,通过图示查看模型应该是一阶、二阶或三阶更加适合。首先操作如下图:

首先放入结果变量y,驱动变量x,2个控制变量。以及设置好断点值为0(默认不设置即为0),选中‘绘图’复选框。至于另外4个参数(带宽值、核函数、阶数和稳健性检验)默认即可。此步骤主要查看绘图,用于确认‘阶数’。得到图形如下:

从上图可以看到,最左侧‘线性拟合’即一阶时或者中间‘二次型拟合’即二阶时,模型拟合相对较好。可能‘二次型拟合’相对更适合。因而确定模型为二阶。并且后续以二阶为准进行分析。另外从上面三个图可以看到,断点值左右两侧附近的样本量基本均匀,即说明断点值选择适合没有受到人为操纵。

第三步、模型基本假定分析

模型基本假定分析时,通常包括‘断点适用性检验’和‘局部平滑性检验’。关于‘断点适用性检验’如果说cutoff值两侧附近的断点样本量基本均匀则说明断点选择适合,不受人为操纵。从第二步中得到的图形也可以看出,断点值附近两侧的点基本差不多,说明当前案例设置的断点值准确,并没有受到人为操纵干扰。

除此之外,还需要查看‘局部平滑性检验’,即分别将控制变量作为驱动变量X进行断点回归,通过图示法查看断点值是否在控制变量身上也起效果,即‘同样的断点值不应该在控制变量身上也起作用’,此检验通常并不完全需要。并且有时候控制变量并不能被当前断点cutoff值区分为两侧因而不能进行分析,本案例即是此类情况,本案例不进行‘局部平滑性检验’。

第四步、模型分析

第一步确认好模型为精确断点,并且第二步确定为二阶模型最优,而且满足基本模型假定。因而进行操作,准备得到最终结果。操作如下图所示:

分别设置结果变量y,驱动变量x,2个控制变量。以及设置好断点值为0(默认不设置即为0),设置为‘二阶’,选中‘稳健性检验’复选框。至于另外2个参数(带宽值、核函数)默认即可,并且将‘绘图’复选框取消(因为已经不再需要通过图示查看阶数)。此步骤为了得到最终结果。见‘SPSSAU输出结果’部分说明。

第五步、模型稳健性检验

在得到模型最终结果时,选中‘稳健性检验’复选框,系统默认提供不同带宽值(0.25倍、0.5倍、0.75倍、1倍、1.25倍、1.5倍、1.75倍和2倍共8个不同带宽值)时的结果,便于进行稳健性检验查看,实际研究中,可能并不需要8个不同带宽值情况下的结果对比,通常只需要1倍带宽值附近(比如0.75倍、1倍和1.25倍)共3项带宽值时结果对比,如果结论基本稳定即说明模型具有稳健性。

模型稳健性检验并没有固定的做法,只要可以证明模型具有稳健性(不同情况下模型结论基本一致则说明具有稳健性),具体稳健性方式上有很多种,一般使用1种或2种即可并没有固定标准。

至于其它的方式,比如‘更换核函数’法,‘更换断点’法,‘是否加入控制变量’法,‘更换阶数’法和‘样本选择法’。研究者可自行更换模型进行结果对比研究。尤其是‘更换核函数’法,‘是否加入控制变量’法和‘更换阶数’这3种方式,其操作简单方便,只需要在SPSSAU系统中下拉选择下参数更换即可进行,建议研究者尝试使用查看对比即可。比如‘更换核函数法’,操作截图如下所示:

SPSSAU默认是使用‘triangular三角核函数’,可选为‘Epanechnikov核函数’和‘Uniform核函数’,来回切换另外两个核函数,将结果进行汇总对比即可,如果结论基本一致则说明模型具有稳健性。

SPSSAU输出结果

针对本案例结果,即‘精确断点’且‘二阶模型’时结果,SPSSAU共输出表格和图形,具体说明如下:

文字分析

本案例得到最终结果,包括RDD基本情况、RDD参数情况、RDD样本数据情况、RDD断点回归结果汇总,稳健性检验结果和稳健性检验coefplot图,分别说明如下:

从上表格可以看到结果变量、处理变量、控制变量或fuzzy项对应的项名称,本案例中有两个控制变量,另本案例最终为精确断点,因而没有设置fuzzy模糊项。

从上表可以看到,断点值为0,并且没有设置过带宽值,模型自动计算出‘最优带宽值’为0.096,并且默认使用三角triangular核函数,模型设定为2阶。以及选中‘稳健性检验’,SPSSAU自动会提供不同带宽值时模型汇总结果。

上表格可以看到,断点值为0,断点值左侧样本量为131个,右侧为218个,总共分析样本量为349个。

上表格可模型结果核心表格,从上表格可以看到,p值均大于0.05,但是小于0.1,也即意味意味着如果以0.1作为显著性水平,那么回归系数呈现出显著性,如果以0.05作为标准,则说明没有显著性。无论是Conventional法,也或者校正bias法(Bias-Corrected),也或者稳健法检验robust时。

提示:

断点回归时对于回归系数的检验共提供3种方式,分别是Conventional法、Bias-Corrected和Robust法,三种方式并没有优劣之分。通常使用其中一种即可,比如Conventional法。下述基于不同带宽稳健性检验时默认汇总Conventional法。

由于本案例时选择‘稳健性’检验,因而SPSSAU提供上表格展示不同带宽值(0.25倍、0.5倍、0.75倍、1倍、1.25倍、1.5倍、1.75倍和2倍共8个不同带宽值)时回归系数显著性检验结果,默认汇总Conventional法的显著性检验结果。从上表格可以看到,8种情况下时,只有其中4种带宽下呈现出0.1水平显著性,另外远离1倍较远的带宽时并没有呈现出显著性。

整体上看,如果模型以0.1作为显著性水平,那么模型具有一定的稳健性(如果是0.05作为标准,则稳健性非常强,因为全部p值均大于0.05)。建议还可进一步通过其它方式,比如‘更换核函数’法,‘是否加入控制变量’法和‘更换阶数’等进一步查看。本案例中如果使用‘更换核函数’,‘是否加入控制变量’或者‘更换阶数’,也会有出现0.1水平显著的结论(但并不完全是),但全部均会出现0.05水平不显著的结论,即意味着如果模型以0.1作为显著性标准,此时模型稳健性较弱,而模型以0.05水平作为标准,此时模型稳健性非常强,无论如何显著性值均大于0.05,最终模型以0.05作为显著性水平,即意味着模型并不显著,即‘民主党当选对于联邦支出并没有实际性影响’,并且此结论非常稳健。

上图为基于不同带宽时,模型回归系数95%置信区间进行展示的coefplot图,从图中可以看到,8种不同带宽时,95%置信区间均包括数字0,即明显的可以看到,模型在0.05水平上不显著,此结论稳定。

剖析

涉及以下几个关键点,分别如下:

  • RDD断点回归时,分析步骤较多,建议逐步进行,且在判断时尽量多的对比综合分析,而不能只查看某一个模型基础上得到最终结论;

  • 多数情况下使用精确断点,如果确实有非常强的理由证明应该使用模糊断点,也可使用模糊断点;

  • 模型阶数判断上结合图示进行,但带有一定的主观性,建议对比选择;

  • 模型假定分析时,图示直观上满足即可,不太可能模型完美的满足;

  • 模型分析时有3种显著性检验方式,选择其中一种即可;

  • 模型稳健性检验有很多种方式,通常选中一个或者两个即可。

    推荐阅读
  • 结婚时床上撒什么东西(结婚时床上有什么)

    结婚时床上撒什么东西首先在床上肯定会放一束花的,这样看起来会比较好看。当然如果老年人喜欢红色的话,换成红色的花也是可以的。其次,一般在婚礼的时候,老人都喜欢在床上被子下面放上一些枣子还有花生。花生应该是寓意着以后的生活很美好,不缺食物食物丰盛的意思。早字的寓意一般就是早生贵子,就是祝愿他们结完婚了以后可以生很多漂亮可爱的孩子。

  • 兔耳朵多肉怎么繁殖 兔耳朵多肉怎么繁殖方法

    在养殖多肉植物的过程中,很多朋友都收获了养殖的乐趣。在生长季节里剪下叶片,用刀将其分割为三段,然后平铺在土壤中。注意要将叶片的一端向下压一压,以便新生根更好地抓住土壤;一般等待二十天新根便会长出。只是同其他时节相比,夏季浇水应该选在清晨和傍晚以后,避免中午高温时浇水。浇水时避免洒在叶片上,应当浇在土中,叶片上的水珠应及时吹散。推荐使用压力喷壶浇水,可以避免上述情况发生。

  • 75寸电视选什么牌子好(最近家里换个75寸的电视)

    而退而求其次是75可以选到量子点的。而且今年的618这的是主要在65-75这个区间降价。对于量子点的75寸电视来说,其实有两个价格区间。因此,如果只是图量子点,那么5000价位其实也是值得选购的。75T8EMax三个相比,推荐TCL75T8EMax。虽然配置差不多,但TCL的色彩相比创维这个要好。根据自己实际情况选即可。价格上75T8EMax可以5999拿,创维最低,只需45xx。TCL电视75T8EMax75英寸QLED原色量子点电视464GB再贵一点的75最值得选的就是这款雷鸟了。配置均衡,性能好。

  • 结婚项链买哪种(结婚项链一般多少克合适)

    众所周知,结婚的时候男方是需要给女方准备三金的,而其中之一就包括了金项链。如果说是新郎佩戴:正常来说新郎是不会佩戴金项链的,通常都是手上戴一个名贵的手表就是。但是对于一些有身份有地位的男性结婚,金项链还是需要佩戴的。男性戴的金项链一般会比女性的要重,一般在二十到四十克左右,如此以来男性的魅力就会更能释放出来。一般来说脖子上所有的金项链加起来有10克左右,当然,如果是婚后用于收藏的,可选择十克以上的。

  • 蒲公英怎么繁殖方法和注意事项(如何繁殖蒲公英)

    蒲公英怎么繁殖方法和注意事项种子繁殖,蒲公英多采用种子繁殖。种子无休眠期,成熟采收后的种子,从春季到秋季可随时进行播种。平畦撒播,亩用种1.5-2.0千克、品质优良的蒲公英良种每亩每亩的播种量仅仅为25-50克。移根繁殖,春季或秋季可采挖野生蒲公英的根,移栽个正好的地块内,行株距15cm*10cm。于10月份,将育出的苗栽植于事先准备好的温室内,栽植密度为10cm*5cm,注意经常见浇水,选择在元旦-春节期间正好上市。

  • 单色印刷用胶版纸还是轻型纸(哑粉纸和双胶纸哪个好)

    哑粉纸又叫无光铜版纸,是铜版纸的一种,铜版纸又称涂料纸,这种纸是在原纸上涂布一层白色浆料,经过压光而制成的。哑粉纸盖章后不易干。现在大多数用户所用的荣誉证书都是采用的双胶纸。

  • 一些非常有趣的小动物的冷知识(多看看可爱的动物)

    研究于2019年12月进行,找来19名测试者,其中15名学生和4名教职员工,在冬季考试期间故意安排时间让测试者看可爱动物的视频和图片,因为这段时间的压力非常大,尤其是医学生。在所有的案例中,测试者在观看视频30分钟后,血压、心率和焦虑都有所下降。记录显示,平均血压从136/88下降到115/71,研究指出“在理想的血压范围内”,平均心率降低到67.4bpm,降低了6.5%。状态-特质焦虑量表是一种经常用于临床诊断焦虑的自我评估方法。

  • 矬怎么读(矬如何读)

    接下来我们就一起去研究一下吧!矬怎么读矬拼音:基本字义身材矮:矬个子。详细字义〈形〉身材短小。〈动〉将身子蜷缩起来。

  • 双色茉莉的叶子变成褐色是怎么回事(为什么双色茉莉的叶子变成褐色)

    下面内容希望能帮助到你,我们来一起看看吧!双色茉莉的叶子变成褐色是怎么回事土壤不适:它喜欢酸性土壤,土壤碱性会使叶片变褐色,可浇灌硫酸亚铁改良土壤。温度较低:养护温度低于10℃会休眠,过于低温会冻伤植株,要注意保暖,室温在12℃以上。

  • 送仙人掌给女生代表什么意思(送仙人掌给女生有什么含义)

    送仙人掌给女生代表什么意思送仙人掌给女生代表她很坚强,像仙人掌一样。仙人掌拥有外刚内柔之心。在造物之初,仙人掌是世界上最柔弱的东西,她娇嫩如水,轻轻一触碰便可能失去了生命。很久之后,有一位勇者要铲除这恶物,剑出刀落,仙人掌变成了两半,从中却是绿色的液体。原来,那是被封存的仙人掌之心,由于无人了解其中的寂寞,化成了滴滴泪珠,绿色的泪珠使柔弱的仙人掌更凸显了她的坚强。