经济学原理

身处美国对自然科学研究有多重要经济学研


ShulamitKahnandMeganJ.MacGarvie.HowimportantisU.S.Locationforresearchinscience?TheReviewofEconomicsandStatistics,May,98(2):–.

1

背景

美国在STEM(Science,Technology,Engineering,andMath)理工科上的的优质研究资源和众多顶尖科研人员使得它成为很多学生的留学追求。但在留学结束之际,毕业生面临着多种选择,如果继续学术之路,到底应该留在美国还是回国发展。

本文利用二十年前美国博士留学生的发展情况,试图解答这样一个问题:美国的地理位置是否使得在美国的科研人员比在其它地区的科研人员更加高产?

为什么美国的地理位置会对科研人员的研究产出有影响?文章给了几个可能的原因。

第一,顶尖科研人员聚集在美国,这种地理位置的相近使得知识扩散和研究合作聚集在美国内部。因此离开美国的科研人员与同僚以及导师合作的机会会下降,导致研究产出减少。

第二,美国的科研资源相较于其它国家更加丰富。无论是对于科研机构的财政支持,位于美国的科研刊物的数量,还是大量的高端学术会议,都给在美国的科研人员提供了互相交流研究的机会。

第三,美国大学对于科研成果十分重视。当然,文章也承认这些优势在全球化的时代可能有所减弱,通讯科技的发达、其它国家对科研的重视、以及私有企业的STEM工作机会的增加都可能使得美国的科研优势在缩小。

直接比较美国和非美国地区的科研人员的研究成果有太多的内生性,因此文章选用的比较对象是同为在非美国出生的、在美国获得博士学位后留在美国工作和离开美国的科研人员。然而这样的比较依然有两个问题,一是科研人员的背景有异质性,二是是否留在美国是一个有内生性的选择。为了解决这两个问题,文章将Fulbright奖学金作为工具变量,借助Fulbright奖学金产生的外生的强制离开美国的要求,对问题进行了分析。本文独特之处是通过整合一系列学术数据库、领英以及谷歌搜索等各来源的数据,构造出了一套以获得Fulbright奖学金为干预组、其它个人指标与干预组匹配的对照组的数据。

2

数据和方法

数据

为将地域对研究产出的影响从其它因素中分离出去,文章对研究对象进行了配对。这是构成干预的重要一步。干预组的数据是从-的国外Fulbright学生花名册中选取,需要满足获取STEM学位,毕业后所处地区可查,并可以找到对照。干预组共有个样本,在所有非美国出生的在美国获得STEM博士学位的科研人员中,研究者为每一个Fulbright学者在相同学校、相同院系内找了一个在相近时间毕业的对照,并在信息允许的情况下对两个人的博士导师和来源地进行了匹配。因此对照组也有个样本。研究者收集了每个样本自毕业到年每年的所处地区和研究产出的信息,生成了一个面板数据,共有个观察值。

方法

本文使用了Heckman两步法。

(1)式中Y为被解释变量,包括发表数、第一作者发表数、末位作者发表数、高影响因子期刊发表数以及各类发表的被引次数共计八个研究产出和扩散(影响力)的指标。LAGFORLOC是由(2)式预测得到的研究对象在前一年是否身处非美国的地区的概率,提前一年是为了体现研究和成果发表之间的时间差(理工科的研究一年就可以出成果,作者这篇文章从07年做到16年才发表,真是人比人气死人啊)。X是一系列外生控制变量,包括年分领域美国博士项目排名的对数、领域虚拟变量、年份和博士学位获取年份的虚拟变量、性别、获取博士学位五年前的母国人均GDP以及在读期间发表数。(2)式中的FULBRIGHT是观测值是否获得Fulbright奖学金的虚拟变量。每一个观测值是从博士毕业到年之间的一个person-year。

Fulbright奖学金是个好工具变量吗?

文章对Fulbright奖学金作为工具变量的强度和有效性进行了说明。Fulbright奖学金的授予对象是非美国国籍的学生,这项奖学金的获得者需要在完成学业两年之内离开美国。这使得Fulbright奖学金获得者与其它非美国国籍的学生在毕业后的就业地点产生外生,而非自我选择的区别。实际数据确认了获得Fulbright奖学金与毕业离开美国是强相关的。对于有效性,即干预组与对照组应有相似的研究潜力,文章认为,为研究对象进行配对的过程中使用了各种搜索方法保证了两组的匹配。

表2展示的是描述性统计的结果。将样本按是否身处美国分类所得的发表数和被引数量的差距比将样本按是否获得Fulbright奖学金的差距更加悬殊。

3

实证结果

表4是文章主要的回归结果。由于文中对于发表和引用这类因变量的统计是计数数据,因而作者采用工具变量泊松模型IVPoissonmodel(Mullahy,)进行估计。Fulbright项目作为地理位置(foreignlocation)的工具变量,第一阶段回归结果报告的F统计量达到.78,表明Fulbright对于地理位置的解释力非常靠谱。并由此得出了一系列强有力的结果,小星星的个数堪比米其林餐厅评级,个数越多,作者越嗨。

首先,PanelA控制所在国GDP之后,结果表明身处美国之外对总发表数量、末位作者的发表量、高影响因子期刊的发表量、高影响因子文章的被引率均有显著的负面影响。对后三者的影响水平各自在-67%、-79%、-72%,但是对第一作者发表量和被引率的影响并不显著。

PanelB在A的基础上,同时控制所在国的GDP和毕业前的发表量,显示差异和显著性水平均有所下降,但对于总发表数量、末位作者的发表量、高影响因子期刊的发表量、高影响因子文章被引率的负向影响依旧显著。由此看出,控制了在校发表量的情况下,负向效应不会那么大。

然而,个体异质性是一个无法逃避的问题!导致个体差异的其中一个关键因素是研究者所在国的财富水平,它可能会影响到负向效应的测度。它的内生性也同样令人存疑,越是高收入国家,科研资源越丰富,研究者更有可能找到工作。作者针对这些问题,将内生变量增加至两个:地理位置滞后期(LAGFORLOC)、地理位置与当前所在国家人均GDP滞后期的交互项(LAGFORLOC*ln(lagged)GDP);PanelC和D将人均GDP由低到高分成四个档位分别评估,依旧各自报告是否控制在校发表量。

从回归结果来看,人均GDP的引入似乎缓和了因地理位置带来的差异。作者发现地理位置带来的负向效应在高收入国家中完全消失啦,相反,在低收入国家中负向效应依旧是很显著的。在没有控制在校发表量时,处于25%收入分位的研究者存在明显的地理位置负向效应;处于50%收入分位的除了第一作者文章被引率外,其余指标都呈现显著负向效应。相比之下,控制在校发表量以后,差异稍稍有所下降,但针对25%和50%分位的国家大部分的负向效应依然显著,尽管第一作者文章被引率在任何收入水平下均没有明显差异。

PanelE-H对于收入差异采用了另一种方法处理,将国家分为两大组,按人均实际GDP由高到低排名,前25%的国家归为更富裕的一组,其余的归为另一组。结果表明来自富裕组国家的科研产出的效应是正向的,但不显著。相反,来自贫穷组国家的效应是负向的,并且对大多数产出指标的影响显著(除了作为第一作者的发表量和引用率)。

4

稳健性检验

介绍完详实的初步实证结果,作者展开了积极的批评与自我批评,把要说的都先自己说了,让别人无话可说。

潜在误差分析

首先最主要的问题是Fulbrightstatus做工具变量的外生性能否保证,Fulbrightstatus与影响location之外的个人内在能力存在一定关系,这使得外生性约束不再成立。作者的分析方法基于Angrist等()研究市民死亡率和法案状态中外生性限制的分析方法。简化起见,考虑线性的2SLS模型,Yi衡量学术产出,Di是LAGFORLOC,Zi代表IV-Fulbrightstatus,Qi表示不可观测的与学生内在能力。如果外生性限制不再成立,则真实模型为下式,此时IV估计量有偏。

假设

推出

其中,γ1代表“qualityeffect”带来的发表情况的增加,α1表示是Fulbright带来的地理位置在美国之外概率的增加,即使γ1是非零的,只要α1的绝对值足够大,即工具变量足够强,带来的估计偏差不会很大。

表5是敏感性分析的结果。考虑三种假设情况:

1、“qualityeffect”不带来偏差;

2.“qualityeffect”带来正的25%的偏差,即Fulbrights被录取进入的是比没有奖学金的情况下会录取他们的学校排名高25个百分点的学校(如进入了哈佛或斯坦福的Fulbrights学生在没有奖学金的情况下可能会进入宾大。)

3.“qualityeffect”带来负的25%的偏差。2SLS回归结果发现,对来自不同收入水平国家的学生来说,不管是25%正或负的差异,结果是一样的。来自低收入国家的学生受地理位置的影响显著为负;高收入国家的学生受到的影响很小,且大部分不显著。显然,如果Fulbrights比他们的同侪优秀,地理位置的负影响会更大;如果Fulbrights不那么优秀,负影响会较小。敏感性分析可以看出,虽然Fulbrightstatus可能内生性问题,但是瑕不掩瑜,结果仍然是非常稳健的。

此外,作者还提到一些可能偏差,如数据来源导致样本中可能包含了更多更高产的科学家,而较少低产出的科学家等。作者在附表中对样本误差可能带来的估计偏差进行了分析,结果显示其影响较小。

其他稳健性检验

前文回归中利用的是个体层面的稳健标准误,表6中panelA-D检验利用压扁了的科学家层面数据是否能得到相似结果。此处,因变量是博士毕业后年份的平均值,主要内生变量是在国外的年数占比,依然用Fulbrightstatus作为其IV,自变量的选取与表4相同。这种设定下,忽略了时间变化效应,也不用考虑样本的观测年份,得出的结果与panel估计是一致的:在国外的年数占比对贫穷国家有较大的显著影响,对富裕国家影响并不显著或有小的正向影响。主要差异在于对末位作者的发表和引用的影响不再显著。

此外,作者还考虑了利用一个国家基础科学和研究的投入(用article-per-capita作为代理变量)代替人均GDP作为控制变量(表6panelE-H),结果并没有太大改变。

不同匹配方法的分析

作者还考虑了另外两种不同的匹配方法来修正Fulbright与控制组的根本性差异。第一种匹配方法是对工具变量Fulbright进行类似于倾向得分匹配。第二种是基于CEM程序,确定一系列变量如学科领域、原来所在国的人均GDP、在校的一作发表数量等形成一个变量组群,在对照组中挑选与之相似的变量组群的对象进行匹配。对于每一种方法,都做两类回归。与表4类似的,第一类回归内生变量是地理位置滞后项,第二类的是地理位置与GDP的交互项。工具变量与之前一致。表7的结果显示地理位置带来的平均影响的差异不在显著,这可能是由于样本量变小。但是,PanelB和D的结果在这个样本下依然延续,低收入国家展现出显著的负效应,而这在高收入国家中并不显著,这与之前的结果保持一致。

5

结论与评价

1.作者利用有效的外生工具变量细致地反复论证了一个结果,那就是相较于低收入国家,无论是从发表数量还是引用率看来,身处美国对于提高科研产出都是有优势的,尤其是对发表高影响因子文章。

2.对于高收入国家的科研人员,其产出水平并不受到是否在美国的影响。

3.文章在样本的选取上存在诟病。样本中仅包含在美国拿到博士学位的非本土科研人员,这些个体与美国科研领域的联系比他们的同胞更为紧密,因而可能更少受到地理位置的影响,更多的影响可能来自于与博士在读期间建立的科研网络的断裂。

4.在全球化快速发展的今天,地理位置的重要性在不断减弱,经济发展水平才是硬道理。

整理:高晶晶、朱逸杉、王霞来源:NSD高级计量经济学

原标题为《身处美国对自然科学研究有多重要?》

赞赏

长按







































专家为你分析白蚀症有何表现
中科白癜风医院



转载请注明:http://www.deudeguo.com/jyxl/604.html


当前时间: