【香樟推文0884】一文告诉你两篇PNAS淮河论文的区别

摘要: 今天的推文将带你比较两篇 PNAS 文章的异同,我们将从数据、估计方法、稳健性检验等方面进行比较。

11-09 17:19 首页 香樟经济学术圈



      20世纪50年代,在“能源奇缺”背景下,周恩来总理提出以秦岭、淮河为界(一月0℃等温线)作为南北供暖线,此线以北定为北方集中供暖区,由政府大量补贴或免费提供煤炭以实现集中供暖。而线以南不实行集中供暖。南北供暖线政策一直沿袭至今。


      近日,由Avraham Ebenstein、Maoyong Fan 、Michael Greenstone 、Guojun He和Maigeng Zhou在《美国国家科学院院刊》(PNAS)作为共同第一作者发表的一篇关于“淮河政策”、空气污染与人口预期寿命的文章吸引了大量媒体报道和公众的眼球(下称“2017年文”)。在2013年,PNAS也发表了一篇相同主题的文章(下称“2013年文”), 其作者有Yuyu Chen、Avraham Ebenstein、Michael Greenstone和Hongbin Li。


      今天的推文将带你比较这两篇文章的异同,我们将从数据、估计方法、稳健性检验等方面进行比较。

输入


一、数据


1)数据集:

      两篇文章都使用了空气污染数据和死亡数据,下表展示了两者数据的异同:


      从数据代表性来看,2017年文数据覆盖人群增加了7倍,覆盖城市数目更多(由于2003年非典冲击所致),且样本期间更接近现在,其因果推断结果对今天的政策制定更具有参考价值。


      另外,2013年文中衡量空气污染的变量为TSPs(总悬浮颗粒物)而2017年文为PM10(可吸入颗粒物),这两者具有很大区别。空气中的悬浮颗粒对人体的危害程度主要决定于其粒度大小及化学组成。直径约小的悬浮颗粒,对人体损害越大。TSP中粒径大于10微米的物质,几乎都可被鼻腔和咽喉所过滤,不能进入肺泡。对人体危害更大的是10微米以下的浮游状颗粒物(PM10),即可吸入颗粒物(直径小于10微米)。可吸入颗粒物可经过呼吸道沉积于肺泡。以往的研究发现,慢性呼吸道炎症、肺气肿、肺癌的发病与空气颗粒物的污染程度明显相关。因此,使用PM10充当空气污染减少预期寿命的解释变量更加科学可靠。各国都设有关于PM10浓度标准,世界卫生组织(WHO)的标准为每年不超过20微克/立方米。


2) 数据构造

      两篇文章在数据构建和匹配上大致相同,都是将空气污染数据与DSP(疾病监测中心)死亡观测数据匹配,并在此基础上进行统计分析。由于2017文年有了更多城市的污染数据,所以在具体匹配的时候可以更精确。2013年文将死亡数据观测点150km范围内的空气数据用两点的距离倒数为权重加权得出;2017年文中,将死亡数据观测点与50km范围内最近的空气检测数据进行匹配,如果50公里内没有空气监测站,那么将50-150km的空气检测站的数据用两点距离倒数为权重加权得出,如果150km范围内没有任何空气检测站点数据,则将该疾病监测站舍弃(共9 个舍弃)。

 

      对于每一个疾病监测站的空气污染数据,由样本开始年份至该年期间的年平均空气污染表示。比如,2007年疾病监测站的空气污染变量为2003-2007年PM10的平均浓度表示。


      对于其他气候信息也采用同样的计算方式,如温度和降雨量等。

 

      疾病监测站的死亡信息面板数据和空气面板数据匹配之后,由于淮河南北RD的设计本质上是横截面性质的,两篇文章的研究者都将面板数据进行了平均,对每一个疾病监测站的得到唯一观测值。





二、数据模型

输12


1) OLS

      两篇文章都首先使用OLS进行估计,2013年文的核心解释变量为 TSP;而2017年文为PM10。被解释变量都为DSP观测点居民的死亡率或预期寿命。


      2013文在回归中,还加入了一系列会影响死亡率和出生预期寿命的控制变量X,包括采暖与制冷度日数、平均受教育年限、制造业就业人数比重、城市户籍人口比重、少数民族占比,自来水覆盖人群比重和地区收入组别变量。


      2017文根据行政区划代码将2005年的人口普查数据与疾病监测站数据进行匹配,在回归中加入了“平均受教育年限”、“少数民族人口比重”、“医疗行业从事人员比重(医生、护士等)”;根据Harvard Geospatial Library 与DSP监测点匹配,在回归中加入“是否在沿海100km内的Dummy”、“地表水污染程度”、“与健康相关的行为”和“人均收入”变量。


      然而,由于空气质量是内生的(一定程度上取决于当地经济发展状况、产业构成),用OLS方法估计空气污染对健康的影响会得到不一致的估计。淮河政策导致的南北空气质量的差异,则提供了一个可靠的准自然实验,用来分离空气污染与其他因素对健康的影响。


2)RD估计方法

      尽管两篇文章都使用了RD的方法进行因果推断,然而,对RD方法的具体使用却大有不同。2013年文中,作者使用了参数回归,分别用线性、二次、三次、四次和五次多项式对总样本进行回归,并主要强调三次方程的结果。而在2017文中,作者主要强调非参数估计的结果。


      根据Gelmen & Imbens(2014),RD 应尽量使用非参数估计,而不是用全局多次方程进行估计。使用全局多次方程估计将带来三个坏处。第一,利用多项式估计,可以理解为加权平均后的处理组的结果与加权平均后的控制组的结果之差。而高阶多项式表示的权重与局部线性回归表示的权重相比显得更加不稳健,这是因为高级多次方程会给离断点非常远的观测点很大的权重,导致所估计的系数与真实的因果关系差别甚远。第二,基于高阶多项式的回归结果对阶数的选择过于敏感,而对阶数的选择还没有统一可行的标准。最后,即使在事实上没有断点的情况下,高阶多项式的估计结果也可能显示有断点出现。而局部线性非参估计的好处在于,研究者无需对函数形成进行假设,另外也赋予断点附近的样本更大的权重,而这正是断点回归能得出干净估计的重点。


      另外,即使在使用高次方程进行断点估计时,也应当对放松断点两边的方程式假设,即需要让断点左右两侧的函数有所不同,具体而言,可以加上North_Dummy×f(L)实现(其中f(L) 为距离淮河线的纬度差L 的函数)。2013文中,作者对南北两侧使用相同的函数形式进行估计,这迫使淮河两侧的函数有相同的斜率。


      首先,在第一阶段,2013文分别对TSP(总悬浮颗粒物)和Y(死亡率或预期寿命)进行了断点识别。



      在第二阶段,2013文 利用一阶段估计得参数得到TSP的预测值,并将其作为解释变量加入对Y(死亡率或预期寿命)的回归中,识别TSP变化对预期寿命的影响。


      作者以三次多项式的估计结果为准,结论为“淮河线”以北由于供暖政策影响使得北方空气中的TSPs浓度比南方高184μg/m3,北方居民因长期暴露于高浓度的TSPs中导致预期寿命减少5.5年,还得出每增加100μg/m3TSPs 会使预期寿命显著减少3年。


      2013年文图示三次方程的参数估计结果:

      2017年文中,作者在基准回归中使用了参数估计(高阶多项式)和非参数估计(local linear regression)。在参数估计中,分别用线性、二次、三次、四次五次多项式对总样本和子样本(距离淮河线5个纬度范围内)进行回归;在非参数回归中,使用Imbens 等提出的不同方法选取最优带宽,并以非参估计为的结果为基本结论。在多项式估计中,作者对南北两侧还使用不同的函数形式估计。

 

参数估计方程:


非参估计方程:

二阶估计方程:


2017年文图示局部线性非参估计结果:

      为了使用非参数估计得到PM10对预期寿命的影响,2017文指出,可以将这一问题视作Fuzzy RD(模糊断点)的应用,得到与工具变量法(instrumental variables)类似的结果。

      结论为,空气中的PM10 浓度每增加10μg/m3会使得预期寿命减少0.64年。


3)RD有效性之前提检验:

      我们知道,在一般的断点因果推断中,必须首先符合断点回归的前提假设,即需满足:

      1)  cut-off point 在事前是不知道的;

      2) forcing variable变量的取值是不能(完全)被操控的;

      3)  其他因素不发生跳跃。

      那么在政策评判标准出来之后(公布cut-off),在断点周围近距离的两组人就不会是systematically 不一样的。

 

保证其他变量不发生跳跃:

      医学告诉我们,影响健康的因素非常多样,在进行“空气污染影响相关疾病死亡率” 这一因果链条推断时,需要说明医学中公认的其他对健康产生巨大影响的因素在南北两侧没有发生跳跃。

 

2013年文做了如下检验:

1)  利用CHNS(1989-2006)和CHIS(1995)年的数据检验了饮食结构和吸烟率在地区间的差异,结论为南北方膳食差异在于,南方人以大米为主食而北方人以小麦为主食,作者认为这种饮食结果不太可能与心肺疾病相关。另外,一般认为长江才是这两种膳食结构的分界线,而不是淮河。数据的缺陷在于没有办法得到与DSP站点匹配的地理信息。关于吸烟率,南北比为:男性,69.2:71.8;女性,2.7:6.9;作者认为此差异与心肺疾病发病率相比而言是非常小的。


2)  作者阐述了其他政策不太可能以淮河线为断点的论据,大多数的政策依赖于行政区划边界,而不是“淮河线”。

 

2017年文做了如下工作:

 

1)结合2010年CDC收集的覆盖所有疾病观测点的与健康相关的行为数据,研究者检验了南北两侧是否在吸烟、酗酒、吃过量红肉和拥有足够运动量方面发生跳跃。结果表明在淮河两侧其他影响健康的重要因素(行为)并没有发生跳跃。


2) 其他政策断点检验:作者分别对医疗政策(以医院数量、内科医生数目为代理变量)、卫生政策(污水处理率和固体垃圾处理率为代理变量)做了检验,结果发现这些政策并不以“淮河线”为分割线。即淮河线南北两侧没有发生跳跃。

 

移民的影响:

      早年,移民现象受到户籍制度的严格管制,但随着市场化进程的不断推进,移民现象越来越普遍,政策管制也在不断放松。显然,随着移民数量的增多,势必对这两篇文章的分析带来挑战。两文的具体应对如下所述。


      2013年文:作者认为移民对RD估计的影响不大。一方面,DSP在统计死亡数据时,将死亡报告分配到死者户籍所在地或出生地;另一方面,由于南北方人口迁移特征不太可能存在显著差异,即不会对RD估计造成不良影响。其样本期间较早,移民较为困难。


      2017年文则结合2010年、2005年的人口普查数据,进一步讨论了流动人口可能对本文估计产生的影响。首先,DSP数据会将在本地居住超过6个月的居民(不管是否与户籍所在地一致)计入其中,使用2008-2012的数据检验,作者发现98.5%的死者拥有本地户籍。这与患有重病的流动人群往往希望返回家乡治疗或者与家人度过最后的日子的选择相契合。这可能让研究所衡量个人受到的长期空气污染程度变量产生偏误;另外,大量的流动人口将有可能挑战文中使用“淮河线”作为RD的做法。


      为了解决以上担忧,作者提出了几种检验。首先,作者利用2010年的普查数据检验了南北两侧的人口分布,结果并没有发现两侧人口有显著区别。其次,作者检验了南北两侧不同年龄段的移民率,同样没有发现断点。第三,作者统计了不同人群在户籍所在地居住的时间,发现平均而言,人们有97%的时间居住在户籍所在地,流动人口则有81%的时间居住在户籍所在地。最后,作者利用2005年的人口普查数据,将流动人口在当地居住的时间占比为权重对其受污染影响进行加权,每个DSP地点使用该地户口居民的平均PM10污染期表示,发现结果依然稳健。作者证明了移民不太可能显著的改变本文的基本发现。


输入


      三、其他稳健性检验


1)异质性(年龄、性别分组)

两篇文章均表明,空气污染对各年龄层均有影响,男女之间并没有显著差异。

 

2)疾病监测数据与空气污染数据匹配方法的敏感性检验

2013年文改变不同的匹配策略,并对其进行与基准回归类似的高次多项式参数回归;2017年文也改变不同的匹配策略,并对每一策略进行参数和非参数回归(使用不同核密度方程)。

 

3)改变样本范围

 2013年文:

a)    改变DSP和空气检测站的最大距离,由150KM改为125,100,75,50,25KM,结果保持一致。

b)    扩展样本,将150km范围内没有任何空气监测点的DSP点也包括进来,

 

2017年文:

a)     将样本限制为2009年以后的污染数据;

b)     将样本限制为直接获得PM10 数据的样本(将有TSPs计算而来的PM10样本删除);

c)      扩展样本,将150km范围内没有任何空气监测点的DSP点也包括进来;

d)     改变DSP和空气检测站的最大距离,由150KM改为200,125,100结果保持一致。

 

4) 2017年文移动供暖线,证明了只有在真的供暖线才有跳跃。

      将供暖线平移做稳健性检验,结果表明只有在真实供暖线才有区别,其他假设的线在95%置信区间内都包括了0。


a)使用Imbens & Kalyanaraman(2012)提出的带宽选择方法。



b)使用 Calonico et al.(2014)提出的带宽选择方法。


      对局部线性回归使用采用不同的带宽选择方法和其他核密度方程,结果均保持一致。

 

5) 2017文讨论了南北差异是否来自其他没有观测到的因素。

 

      2017 文还使用Oster E (2016) 提出的方法讨论了如果南北的差异是由于别的没有观测到的因素的影响的话,这些因素需要起到多大的作用才能将差异抹平,并讨论了这种可能性微乎其微。


      Oster E(2016)的想法可以简单的陈述为,为了检验估计结果对没有观测到的因素影响的敏感性,我们可以用处理组合控制组在观测到的变量间的差异来推测未观测到的因素的组间差异。具体而言通过在基准回归中加入其他协变量后观察R方的变化,以此推测未观测到的变量也会引起类似的变化。作者的检验表明,其他未观测到的因素至少要比观测到因素的影响力(解释力)大2-3倍才能使估计结果抹平为0,由于已经观测到的变量大部分都是影响健康的关键变量(如收入、医疗条件、吸烟、饮酒、饮食、运动、以及水污染等),所以没有观测到的遗漏因素几乎不可能抹平现有估计结果。这使得估计结果更加可信。



      四、预期寿命的计算

输12

1、   2013年文计算的预期寿命在74-75岁之间,而在这一样本期间内(1991-2000),根据世界银行的数据,中国人的预期寿命在69-70岁之间。两者相比,有近5岁的差别,不知道是什么原因导致的?

 

2、   2017年文中计算出的预期寿命为76岁与2012年世界银行公布的中国预期寿命一致。 



输入


五、总结


      总的来说,2013年文的学者们独具慧眼,看到了“淮河”政策提供的断点回归机会。虽然文章结果引起大量争议,但对RD方法的推广和普及、以及让更多人关注空气污染问题起到的极其重要的作用。2017年文则在数据、方法和稳健性检验等方面做出了改进并对一些关键问题做了更加细致的研究工作。使用更好的数据、更科学的方法以推进重要的研究课题是学术界在传承中得以不断进步的原因之一。当然,任何研究都不可能完美,2017文可能也一定有需要进一步讨论、完善和改进的地方。


      两篇文章均表明,空气污染对人体健康有巨大的负面影响。就政策而言,政府应该通过利用更清洁能源进行冬季供暖,以达到在降低空气污染的同时让人们享受到供暖的便利。



References


1. Oster E (2016) Unobservable selection and coefficient stability: Theory and evidence. J Bus Econ Stat, 10.1080/07350015.2016.1227711.


2. Imbens G, Kalyanaraman K (2012) Optimal bandwidth choice for the regression discontinuity estimator. Rev Econ Stud 79:933–959.


3. Gelman A, Imbens G (2014) Why high-order polynomials should not be used in regression discontinuity designs. Working paper 20405 (NBER, Cambridge, MA).


4.Chen Y, Ebenstein A, Greenstone M, and Li H (2013) Evidence on the Impact of Sustained Exposure to Air Pollution on Life Expectancy from China’s Huai River Policy. Proceedings of the National Academy of Sciences 110(6): 12936-41


5.Ebenstein A, Fan M, Greenstone M, et al. New evidence on the impact of sustained exposure to air pollution on life expectancy from China’s Huai River Policy[J]. Proceedings of the National Academy of Sciences, 2017: 201616784.

 



香樟经济学术圈征稿

输入

“分享”是一种学者的人文情怀,香樟经济学术圈欢迎广大订阅读者(“香粉”)向公众平台投稿,也诚邀您加入香樟推文team。生活处处皆经济,经济处处现生活。如果你或者身边的朋友看了有趣的学术论文,或者撰写了经济政策评论,愿意和大家分享,欢迎投稿(经济金融类),投稿邮箱:cectuiwen@163.com。如果高校、研究机构、媒体或者学者,愿意与平台合作,也请您通过邮箱联系我们。




本期小编:王璐





首页 - 香樟经济学术圈 的更多文章: