潘哲文,周先波:样本选择与数据删失同时发生时如何建模与估计?

发布人:金钊

我院潘哲文副研究员、周先波教授与上海财经大学周亚虹教授合作的论文《Semiparametric estimation of a censored regression model subject to nonparametric sample selection》于2020年8月在计量经济学国际权威期刊《Journal of Business & Economic Statistics》在线发表。

image-20220614200314-1

样本选择与数据删失是微观经济学实证研究中经常遇到的两类数据问题,前者来源于个体自选择行为所导致的样本非随机性,后者则一般来源于数量决策背后的效用最大化模型的角点解,两者有可能同时发生。以香烟消费为例,样本中的零消费数据一部分是因为受访个体不愿意吸烟(自选择行为),另一部分则是因为在当前的收入和价格条件下,零香烟消费是最优决策(角点解)。然而,目前计量经济学文献对于同时存在样本选择问题和数据删失问题情境下的半参数估计方法研究仍相对缺乏。

本文考虑受制于样本选择的删失回归模型,这是一个两方程的模型:参与方程用于刻画样本选择过程,数量方程加入归并结构用于刻画数据删失过程,因此该模型可用于对同时存在样本选择问题与数据删失问题的数据进行计量经济学建模。本文对该模型展开理论研究,主要贡献体现在识别和半参数估计两个方面。

在识别方面,目前主流文献认为受制于样本选择的模型需要排外性约束作为数量方程系数识别的必要条件,即参与方程至少有一个变量不在数量方程中,但在实证研究中找到这样的变量并不是一件容易的事。本文研究表明,只要把参与方程设定为非线性形式,数量方程系数的识别就不再依赖于排外性约束,这无疑为实证研究创造了便利。

在估计方面,本文除了放松参与方程的线性假定,还放松了模型扰动项的正态分布假定,在参与方程函数形式未知以及扰动项分布形式未知的情形下,提出了数量方程系数的一种半参数估计方法,并证明了新估计量的一致性和渐近正态性。数值模拟结果显示,这种半参数估计量具有良好的有限样本表现。将新方法用于估计烟草消费方程后,本文得到了更为显著以及更加合理的回归系数估计。