@1007477689
2020-04-29T15:02:08.000000Z
字数 3722
阅读 1366
未分类
我们今天的猪脚不是已故经济学泰斗萨缪尔森了,我们的今天的猪脚是这位大哥:詹姆斯·赫克曼(James J.Heckman)。这也是以为超级猛人。号称微观计量经济学之父。他还是2000年的诺贝尔经济学奖获得者。
詹姆斯·赫克曼(James J.Heckman)1944年生于美国芝加哥,曾就读于科罗拉多学院(Colorado College)数学系,1971年获普林斯顿大学经济系博士学位。曾在哥伦比亚大学、耶鲁大学、和芝加哥大学任教。从1995年起,赫克曼就在芝加哥大学获任亨利-舒尔茨杰出成就经济学教授,现为芝加哥大学的教授。赫克曼在经济学领域的研究内容涉及诸如社会项目评估、非连续选择和纵向数据的计量经济学模式、劳工市场经济学以及收入分配的模式选择等等。
今天聊一下计量经济学。其实,你记住以下“十二条军规”,你的计量经济学知识就基本掌握了。
注意一下什么叫“厌恶参数”。记住以下事实,统计学分为两大派系:一个是频率派系,一个是贝叶斯派系。一般的实证(经验)计量学都是基于频率派系,比如我们说的OLS。频率派系经常遇到“厌恶参数”问题,但在贝叶斯学派中,一般不会“厌恶参数”问题,贝叶斯学派遇到的是先验分布如何设置的问题。
此外,频率学派是微观计量经济学领域的主流,但在机器学习理论和宏观计量经济学中,贝叶斯学派是研究问题的主流方法。
反复强调,我们这里提到的“频率”这个词和时间序列分析里面提到的基于傅立叶变换(Fourier Transform)的频域(或频率)分析理论理论完全不同。此外,读者在看到带通(band pass)、高通(high pass)、低通滤波器(low pass filters) 时,也不要将这些概念和后面我们会提到的卡尔曼滤波器的概念相混淆,它们虽然都叫“滤波器”,但是原理不一样,带通、高通、低通滤波器和傅立叶变换有关。
“标准误”对应“同方差”。“稳健标准误”对应“异方差”。OLS 对应同方差,GLS对应异方差。相关概念都涉及“球型扰动”。
或者这么说:如果发现存在异方差,一种处理方法是,仍然进行 OLS 回归,但请使用“稳健标准误”。只要样本容量较大,即使在异方差情况下,若使用稳健标准误,则所有参数估计、假设检验均可照常进行。换而言之,只要使用了稳健标准误,就可以与异方差和平共处。简而言之,采取稳健标注误不会改变参数估计的具体值,但会改变-值(即:一般而言提高估计的有效性)。
计量经济学不喜欢异方差、序列自相关和共线性。
能处理异方差的模型有很多,比如直接用 GLS 就能解决异方差问题。序列自相关一般是利用时间序列 ARMA 等方法。对于最后一个问题 —— 共线性问题,当然,这个问题解决起来要简单很多。
浅论因果性。
“因果倒置”是计量经济学研究中最怕发生的事情,导致解释变量和被解释变量间出现因果倒置,主要的原因是:在计量研究的识别过程中,研究过程违反了“外生性假定”,出现了“内生性问题”。
解决内生性问题主要是依靠两种方法,一种是后面会提到的“反事实分析法”,第二种方法是利用工具变量法。导致内生性问题一般有三个原因:
更多的讨论可见前文的内生性问题讨论章节。
2SLS 是一种工具变量法,前提是:满足球型扰动同方差。GMM 也可以看成是一种工具变量法,它适用于:球型扰动项异方差。所以有人说:“2SLS类似于 OLS,GLS 类似于 GMM”。
此外,GMM 经济学含义很强,请记住以下结论:OLS 家族都可以看成是 GMM,MLE 也可以看成是 GMM。林文夫(Fumio Hayashi)的计量经济学教材[1]就是从GMM展开的整个故事。
此外,对于非线性模型,GMM 将无法使用,所以在非线性模型中 MLE 就成了主流。人工智能的分支—机器学习理论涉及的模型很多时候都是非线性的(比如:神经网络、SVM等),于是在机器学习理论领域,MLE 成了参数估计的主流方法。此外,GMM 的预测能力不强,远不如 MLE,一个可能的原因是 GMM 仅使用样本数据的矩信息,所以往往被称为是半信息法,而 ML 被认为是全信息法。
参数估计法就三种:
极大似然估计方法小样本有偏,但大样本无偏,在处理大样本数据的时候,使用极大似然方法是可以心安理得。后面我们学的很多模型都是非线性,遇到非线性模型我们只能指望极大似然方法,并且为了避免有偏,我们必须冀望我们使用的数据是样本数量足够大。
关注OLS的大样本的五大假定,它们分别是:
特别需要注意的是,大样本 OLS,无须假设“严格外生性”与“正态随机扰动项”,具有更大的适用性与稳健性。
此外,鞅(martingale)的概念,这个概念是金融数学的基本立论基础。
OLS 估计量的大样本性质,主要是关于b的一致性估计量、b的渐进正态和Avar(b)的一致估计量性质。
工具变量的检验一般要涉及三个问题的检验,第一个问题是不可识别检验,第二个问题是弱工具变量检验,第三个检验是过度识别检验。此外,到底是用OLS族还是工具变量法,关键是在于你原来的模型是否存在“内生性”问题。也就是说,任何问题,你应该从OLS做起,然后去思考(检验)模型是否有异方差、是否有序列自相关,是否有共线性,如果OLS这些问题都很好解决了,就没有必要去用2SLS或者GMM。特别注意:科学界的基本信条是信奉“简洁性(parsimony)”。有很多自然科学界(包括社会科学界)的顶级大牛都反复强调过:“如果能用简单模型,就一定不要用复杂模型。好的科学家都是极度吝啬的吝啬鬼”。可以认为,这是科学研究的基本信条(creed),科研人员切忌不要为了显示数学功力就为了“模型”而乱发明模型。如果利用OLS分析框架进行计量经济学研究时,发觉OLS识别不理想(比如:若干参数不显著),那就得思考是否是因为“内生性”问题所导致,是否是模型设置错误,一旦涉及到内生性问题,最直接的方式考虑引入工具变量,一旦引入工具变量法,就就需要考虑使用2SLS或者GMM。
是否解释变量有外生性,主要是利用“豪斯曼检验”,也就是说当读者看见豪斯曼检验时,读者脑子里需马上想到“内生性检验”。传统豪斯曼检验不适用于异方差情形。改良的办法是使用Durbin-Wu-Hausman Test(DWH)。此外豪斯曼检验还会在研究固定效应还是随机效应中有应用。此外,在独立同分布扰动项的假设下,过度识别检验一般采用Sargen检验,而非Hansen J统计量。此外,Sargan(萨甘)统计量是用来检验“过度识别”问题的。
实证(经验)计量经济学的武器库还有以下模型:除了以上提到的有: OLS、GLS、WLS、2SLS、GMM、FGLS。还有一些计量经济学的大类模型,其中包括:
虚拟变量法类模型,这类模型的解释变量x的取值只能是离散数值,而被解释变量y的取值是连续的。
被解释变量的取值是离散(比如只能取二值或多值):这类型又细分为:二值选择模型、多值模型以及排序与计数模型,此外这类问题(指被解释变量为离散值)都不适用于OLS作为估计法,所以一般参数估计都是MLE估计出来。其中关于二值选择模型,需要关注Logit和Probit模型。特别注意,这类模型特别适合研究微观经济学的边际效应(marginal effect)问题,以及稀有事件模型、含内生变量的Probit模型、双变量Probit模型。这类模型还包括:部分可观测的双变量、多值选择模型、多项logit模型与多项probit模型、条件logit模型、混合logit模型、嵌套logit模型。
排序与计数模型也在计量经济学中有非常重要的作用。其中包括:Poisson 模型(计数模型的一种,最常用的一种)、负二项回归、零膨胀Poisson回归和负二项回归。
在某些情况下,被解释变量y的趋势范围可能受到限制,这类计量模型被称为:受限被解释变量模型,这一类模型主要有是三组模型:断尾回归(truncated regression)、归并回归(censored regression)以及样本选择模型。
结构计量经济学模型主要针对多个方程进行研究,这类估计模型包括:SUR和3SLS,也包括SVAR。
分位数回归是这几年计量经济学研究的热点,其主要是思想如下:传统的计量其实研究的都是“均值回归”(比如:最小二乘法),最小二乘法可以被认为是一种损失方程(loss function),如果把损失方程定义为绝对值而不是“绝对值差的平方”,这就是分位数回归的思路。此外,空间计量经济学和久期模型也值得关注。空间计量经济学是新的学科,但很多东西都不是很成熟。而久期模型,这类模型应用在保险领域。
“处理效应”属于实验设计(比如“反事实分析法”),目前实证研究的重点更多是关注实验的设计,请结合本章重点讨论的选择性偏误问题,反事实分析是目前当代计量经济学重要的实证分析方法和手段。