刘晓蕾:实证研究中如何确定因果关系

  • 时间:
  • 浏览:213
  • 来源:世界杯买球盘口网址app

知网最近做了一个关于《金融学术研究能力提升》的系列讲座,从3月9日起连续至4月3日。今天是第二天的内容,刘晓蕾老师为我们讲述了“实证研究中如何确定因果关系”。

刘老师是北京大学博雅特聘教授,光华治理学院金融系系主任,北京大学金融及会计系教授,博士生导师。曾获得安子介国际商业研究奖、美国西部金融协会最佳论文奖、中国国际金融集会最优论文奖等奖项。

围绕“实证研究中如何确定因果关系”这个问题,刘老师循循善诱,依次讲了“实证研究的目的”、“确定因果关系的重要性及难题”,最后针对这些问题给出了常用的几个方法。

以下为条记正文:

为什么因果关系重要

为了回覆这个问题,我们首先要弄明确实证研究的目的是什么?

做文章,首先是为了明白经济世界的运行规则;在此基础上给政府宏观政策提供建议,好比“减税是不是能拉动投资,刺激消费”;也可以给企业提供建议,像“公司治理,broad如何组建”这样的问题,最后也能给小我私家决议提供建议。

而这些问题,都需要我们确定变量间的因果关系之后才气回覆。

我们来举一个常见的“伪”因果关系的例子,新浪康健网站放出一个陈诉:恒久只身少活十年!

陈诉撰写者凭据种种翔实的数据得出结论,只身女性比完婚女性寿命短7-15年,只身男性比完婚男性寿命短8-17年。研究者将“是否只身”作为自变量,“寿命短”作为因变量,做出的回归效果显示二者的影响关系很是显著。那么,我们凭据这个效果是否真的能得出“恒久只身少活十年”的结论呢?显然不能。因为在“是否只身”和“寿命短”两个变量的影响路径中,另有很是多的、我们看不见的变量在起作用。

好比:穷、忙、基因……

这些看不见的变量叫omittedvar,同时影响该研究中的自变量x var、因变量y var,所以只身与寿命短并不是因果关系。

除了“伪”因果关系,另有一个确定因果关系的阻碍——反向因果。

针对这种情况,我们再来举一个例子:研究发现,董事会每年召开集会次数x越多,公司体现y越差?

对该模型Y=α+β*x举行回归,获得了β小于零且很是显著的效果。这就证明晰上述结论吗?no,为什么不想想,是不是公司业绩体现差才导致召开集会次数多呢?

这些例子都说明:相关性≠因果关系,而我们想看到的是x var cause y var.

那么,为了确定因果关系,经济学家们都设计出哪些方法来解决呢?

现在较为常用的有下列六种,划分是:

同卵双胞胎(这是一种可遇不行求的研究方法);

随机试验randomized field experiment(去年诺奖获得者所作研究就使用这种方法);

自然实验 natural experiment,quasi-experiment;

工具变量IV;

断点回归设计RDD;

结构参数预计 structuralestimation(控制内生性);

六个确定因果关系的方法

在开始先容这六种方法之前,我们需要先明确treatment & counterfactual两个观点。

treatment(X)即我们感兴趣的解释变量;

counterfactual代表如果没有treatment(其它稳定)的话,我们视察到的数据(Y)是什么样,通常在社会科学研究中是视察不到的,所以应该设计方法找到它。

一、同卵双胞胎

家庭配景、教育情况、基因决议的能力等这些在一般研究中无法控制的因素都能在同卵双胞胎的样本中获得很好的控制。这时,我们就可以在双胞胎中随机选取一个给予“treatment”来视察Y| treatment和Y|no treatment(即counterfactual),对比效果之后便可以得出treatment对Y发生的效果(treatmentcauses Y)。

针对这种方法比力著名的一个研究是Hongbin Li(2012)揭晓在JDE的一篇文章:

Estimating returns to education using twins in urban China

文章研究了教育是否有用这个很是有意义的问题。可是我们知道,那些能够受到良好教育的人,通常是较为智慧的人,从而拿到了较高的收入;此外家庭配景好的人,能支付更多教育用度,进而获取更多收入……这都是omitted var问题。

那么文章选取统计局城镇观察大队2002年6、7月份对488对同卵双胞胎观察获得的数据举行研究。当对全样本举行OLS回归后,在收入 = a*教育水平+ b*控制变量的模型中,系数a = 0.084***(14.14)。而当控制了双胞胎牢固效应后,在Δ收入_双胞胎 = a*Δ教育水平_双胞胎的模型中,a = 0.027*(1.87),分外一年的教育增加带来的收入增加变少,说明counterfactual被牢固效应模型找出来一部门。

接着,Li又对双胞胎样本根据受教育水平举行分组,控制了双胞胎牢固效应后,Δ收入_双胞胎 = a*Δ教育水平_双胞胎的回归效果为:

高中教育:a = -0.003(0.04);

技校教育:a = 0.168**(2.09);

大学教育:a = 0.278***(2.45);

可以看到大学教育对收入水平的正向影响是很是显著的,其次是技校教育,但高中教育组却获得了负的回归效果。作者给出的解释是:由于大学教育资源不足,使得高中学习的一个重要任务是高考,而高中自己学到的知识是有限的,并不能为进入就业市场带来优势。

二、随机试验(双差法)

一般接纳双盲实验,好比新药测试。此时实验组和控制组不再一一对应,而是存在差异性(heterogeneity),但由于分组是随机的,凭据大数定律,视察不到的差异性就与treatment无关。那么,Y|实验组和Y|控制组中,后者即为counterfactual.

关于这个方法,刘老师举了携程总裁梁建章(最会做学术的老板,最会做生意的科研人)对携程上海呼叫中心所做的实验:2010年,在公司996个雇员中自愿回家事情的503人里选择了249个,对他们在家事情体现和其它员工在公司事情的体现作对比,研究效果揭晓在QJE:

Does working from home work? Evidence from a Chineseexperiment

那么,在这个例子中,这249名挑选出的切合要求的员工是否可以全部拿来做实验呢?谜底是不行以。凭据随机试验原则,梁建章对这249名员工使用抽签,决议偶数日子出生的雇员回家事情,而奇数日子出生的雇员仍留在公司上班。

使用双差法所结构的模型为:

Y=α+β*experiment time+γ*treatment+η*experiment time*treatment+control+ε

A——α

B——α+β

C——α+γ

D——α+β+γ+η

DID——η

回归效果显示,雇员每周接电话次数的对数系数为0.120,代表与回家事情相比(控制组),员工事情效率提升了13%(exp(0.12)=13%).

……

三、自然实验;

四、工具变量IV;

五、断点回归设计RDD;

六、结构参数预计 structuralestimation(控制内生性);

三、四、五、六我们下次再讲吧,敬请期待。没看够的可以温习一下之前的讲座内容。

往期回首:

1、姜富伟:大数据与人工智能时代的资产订价研究

2、邢天才:我心目中的金融学研究生教育——基于东北财经大学的实践

3、吴文峰:中国制度配景下的金融研究

4、朱小能:基本面、信息情况与金融市场

5、方颖:计量经济学训练与金融学研究——从实证经济学的可信性革命谈起

6、王擎:毗连宏观、微观的金融研究

7、吴卫星:家庭金融研究——从微观到宏观

8、范小云:开展基于金融现实的学术研究

9、田轩:如何在学术界活下去