计量经济学 重点
第一章 经济计量学的特征及研究范围
(1)经济计量学是利用经济理论、数学、统计推断等工具对经济现象进行分析的一门社会科学;
(2)经济计量学运用数理统计学分析经济数据,对构建于数理经济学基础之上的模型进行实证分析,并得出数值结果。
(1)计量经济学与经济理论
经济理论:提出的命题和假说,多以定性描述为主
计量经济学:依据观测或试验,对大多数经济理论给出经验解释,进行数值估计 (2)计量经济学与数理经济学
数理经济学:主要是用数学形式或方程(或模型)描述经济理论 计量经济学:采用数理经济学家提出的数学模型,把这些数学模型转换成可以用于经验验证的形式
(3)计量经济学与经济统计学
经济统计学:涉及经济数据的收集、处理、绘图、制表 计量经济学:运用数据验证结论
(1)建立一个理论假说 (2)收集数据 (3)设定数学模型
(4)设立统计或经济计量模型 (5)估计经济计量模型参数
(6)核查模型的适用性:模型设定检验 (7)检验源自模型的假设 (8)利用模型进行预测
(1)时间序列数据:按时间跨度收集到的(定性数据、定量数据); (2)截面数据:一个或多个变量在某一时点上的数据集合; (3)合并数据:包括时间序列数据和截面数据。
(一类特殊的合并数据—面板数据(纵向数据、微观面板数据):同一个横截面单位的跨期调查数据)
第二章 线性回归的基本思想:双变量模型
用于研究一个变量(称为被解释变量或应变量)与另一个或多个变量(称为解释变量或自变量)之间的关系
(1)根据自变量的取值,估计应变量的均值; (2)检验(建立在经济理论基础上的)假设;
(3)根据样本外自变量的取值,预测应变量的均值; (4)可同时进行上述各项分析。
(1)概念:反映了被解释变量的均值同一个或多个解释变量之间的关系 (2)表达式:
①确定/非随机总体回归函数:E (Y|Xi )=B1+B2X i
B 1:截距;B 2:斜率
从总体上表明了单个Y 同解释变量和随机干扰项之间的关系 ②随机/统计总体回归函数:Y i =B1+B2X i +μi μi :随机扰动项(随机误差项、噪声) B 1+B2X i :系统/确定性部分 μi :非系统/随机部分
(1)定义:代表了与被解释变量Y 有关但未被纳入模型变量的影响。每一个随机误差项对于Y 的影响是非常小的,且是随机的。随机误差项的均值为0 (2)性质
①误差项代表了未纳入模型变量的影响; ②反映人类行为的内在随机性; ③代表了度量误差;
④反映了模型的次要因素,使得模型描述尽可能简单。
(1)概念:是总体回归函数的近似 (2)表达式
①确定/非随机样本回归函数:Ŷi =b1+b2X i
b 1:截距;b 2:斜率
②随机/统计样本回归函数:Y i =b1+b2X i +ei e i :残差项(残差),e i = Yi -Ŷi B 1+B2X i :系统/确定性部分 μ:非系统/随机部分
(1)E (Y|Xi)(条件期望):在解释变量X 给定条件下Y 的条件期望,可以通过X 给定条件下的条件(概率分布)得到;
(2)非条件期望:在不考虑其他随机变量取值情况时,某个随机变量的期望值。它可以通过该随机变量的非条件分布或边缘分布得到。
回归参数为线性(B )的模型
线性回归模型中的B 参数
)
说明了如何通过样本数据来估计回归系数Bs ,计算出的回归系数的值称为样本回归估计值
(1)随机样本回归函数:从所抽取样本的角度说明了被解释变量Y i 同解释变量X i 及残差e i 之间的关系;
(2)随机总体回归函数:从总体的角度说明了被解释变量Y i 同解释变量X i 及随机误差项μ之间的关系。
(1)变量线性:应变量的条件均值是自变量的线性函数
此解释下的非线性回归:E (Y )= B1+B2X i 2;E (Y )= B1+B2×1/Xi (2)参数线性:应变量的条件均值是参数B 的线性函数
此解释下的非线性回归:E (Y )= B1+B22X i *线性回归在教材中指的是参数线性的回归
(1)确定/非随机总体回归函数:E (X )=B1+B2X 2i +B3X 3i +B4X 4i (2)随机/统计总体回归函数:Y i = B1+B2X 2i +B3X 3i +B4X 4i +μi
(1)最小二乘 以残差(被解释变量的实际值同拟合值之间的差)平方和最小的原则对回归模型中的系数进行估计的方法。 (1)表达式
(2)重要性质
①用OLS 法得出的样本回归线经过样本均值点:
;
②残差的均值()总为0;
③对残值与解释变量的积求和,其值为0,即这两个变量不相关:④对残差与Ŷi (估计的Y i )的积求和,其值为0,即
第三章 双变量模型:假设检验
(1)回归模型是参数线性的,但不一定是变量线性的:Y i =B1+B2X i +μi (2)解释变量X 与扰动误差项μ不相关
(3)给定X i ,扰动项的期望或均值为0:E (μ| Xi )=0
(4)μi 的方差为常数,或同方差:var (μi )=σ2(每个Y 值以相同的方差分布在其均值周围,非这种情况为异方差)
(5)无自相关假定:两个误差项之间不相关,cov (μi ,μj )=0
(6)回归模型是正确假定的:实证分析的模型不存在设定偏差或设定误差
运用最小二乘法计算出的总体回归参数的估计量
(1)
的方差与标准误
①方差:②标准误:
(2)的方差与标准误
①方差:②标准差:(3)
的计算公式
(n-2为自由度:独立观察值的个数)
(4):回归标准误
,常用于度量估计回归线的拟合优度,值越小,Y 的回归
值越接近根据回归模型得到的估计值
(1)b 1和b 2是线性估计量:它们是随机变量Y 的线性函数 (2)b 1和b 2是无偏估计量:E (b 1)=B1,E (b 2)=B2 (3)E (σ^2)=σ^2:误差方差的OLS 估计量是无偏的
(4)b 1和b 2是有效估计量:var (b 1)小于B 1的任意一个线性无偏估计量的方差,var (b 2)
小于B 2的任意一个线性无偏估计量的方差
(1)新加的假设:在总体回归函数Yi=B1+B2X i +μi 中,误差项μi 服从均值为0,方差为σ^2的正态分布:μi ~N (0,σ^2) (2)OLS 估计量服从的分布情况:
b 1~N(B 1,σ2b1) b 2~N(B 2,σ2b2)
(1)使用公式
(近似)
(2)方法
①置信区间法
②显著性检验法:对统计假设的检验过程 (3)几个相关检验
①t 检验法:基于t 分布的统计假设检验过程 ②双边检验:备择假设是双边假设的检验 ③单边检验:备择假设是单边假设的检验
2(P53-P56) (1)重要公式:
①总平方和(TSS )=②解释平方和(ESS )=方和(由解释变量解释的部分)
③残差平方和(RSS )=
:Y 变异未被解释的部分 :真实Y 值围绕其均值
(TSS=ESS+RSS) 的总变异;
)的变异,也称为回归平
:估计的Y 值围绕其均值(Ŷ=
(2)r 2(判定系数)的定义:度量回归线的拟合程度(回归模型对Y 变异的解释比例/百分比)
(3)r 2的性质
①非负性 ②0≤r 2≤1 (4)r 2的计算公式
(5)r 的计算公式
方差相同
方差不同
最佳线性无偏估计量,即该估计量是无偏估计量,且在所有的无偏估计量中方差最小
拒绝零假设的简称
第四章 多元回归:估计与假设检验
E (Y i )=B1+B2X t + B3X 3t Y i =B1+B2X 2t + B3X 3t +μi
,B ):
(1)B 2:在X 3保持不变的情况下,X 2单位变动引起Y 均值E (Y )的变动量 (2)B 3:在X 2保持不变的情况下,X 3单位变动引起Y 均值E (Y )的变动量
(1)回归模型是参数线性的,并且是正确设定的 (2)X 2,X 3与扰动误差项μ不相关
①X 2,X 3非随机:自动满足
②X 2,X 3随机:必须独立同分布于误差项μ (3)误差项的期望或均值为0:E (μi )=0 (4)同方差假定:var (μi )=σ2
(5)误差项μi ,μi 无自相关:两个误差项之间不相关,cov (μi ,μj ) i ≠j (6)解释变量X2和X3之间不存在完全共线性,即两个解释变量之间无严格的线性关系(X 2不能表示为另一变量X 3的线性函数) (7)随机误差μ服从均值为0,(同)方差为σ^2的正态分布:μi ~N (0,σ2)
(1)完全共线性:解释变量之间存在的精确的线性关系
(2)完全多重共线性:解释变量之间存在着多个精确的线性关系
(1)b 1的方差与标准误
(2)b 1的方差与标准误
(3)b 3的方差与标准误
(方法类似于第三章)
(1)联合假设:H 0:B 2=B3=0(H 0:R 2=0)(多元回归的总体显著性检验)
(2)F 分布公式
之间的重要关系(P82-P83) (1)关系式
会导致模型中遗漏相关变量
(1)作用
衡量了解释变量能解释的离差占被解释变量总离差的比例
(2)公式
(3)性质 ①如果k >1,则
≤R 2,即随着模型中解释变量个数的增加,校正判定系数越来越小于
非校正判定系数
②虽然未校正判定系数R 2总为正,但校正判定系数可能为负
(1)受限模型:B 2=B3=0
(2)非受限模型:包含了所有相关变量
(3)受限最小二乘法:对受限模型用OLS 估计参数
(4)非受限最小二乘法:对非受限模型用OLS 估计参数 (5)判定对模型施加限制是否有效的F 分布公式
(1)单个多元回归系数的显著性检验
①提出零假设和备择假设; ②选择适当的显著性水平;
③在零假设为真的情况下,计算t 统计量;
④将t 统计量的绝对值|t|同相应自由度和显著性水平下的临界值相比较;
⑤如果t 统计量大于临界值,则拒绝零假设。该步骤中务必要使用合适的单边或双边检验。
(2)所有偏斜率系数的显著性检验
①零假设:H 0:B 2=B3=...=Bk =0,即所有的偏回归系数均为0; ②备择假设:至少一个偏回归系数不为0; ③运用方差分析和F 检验;
④如果F 统计量的值大于相应显著性水平下的临界值,拒绝零假设,否则接受; ⑤
(3)在(1)和(2)中可以不事先选择好显著性水平,只需得到相应统计量的p 值,如果p 值足够小,我们就可以拒绝零假设。
第五章 回归模型的函数形式
第六章 虚拟变量回归模型
因变量受到一些定性变量的影响,这类定性变量称为虚拟变量,用D 表示虚拟变量,虚拟变量的取值通常为0和1
引入的虚拟变量个数应该比研究的类别少一个,否则就会造成完全多重共线,即通常说的虚拟变量陷阱
包含一个定量变量、一个定性变量的回归模型 (1)只影响截距(加法模型)
(2)只影响斜率(乘法模型)
(3)同时影响截距与斜率(混合模型)
:交互作用虚拟变量
这类变量的取值不是一般的数据(数值变量或定量变量),它们通常代表所研究的对象是否具有的某种特征。
解释变量仅包含定型变量或虚拟变量的回归模型。
回归模型中的解释变量有些是线性的,有些是定量的。
包含此变量的模型能够分辨被解释变量的均值在不同类别之间是否相同。
包含此变量的模型能够分辨不同类别之间被解释变量均值变化率的变化范围
第七章 模型选择:标准与检验
(1)简约性:模型应尽可能简单;
(2)可识别性:每个参数只有一个估计值;
(3)拟合优度:用模型中所包含的解释变量尽可能地解释应变量的变化; (4)理论一致性:构建模型时,必须有一定的理论基础; (5)预测能力:选择理论预测与实践吻合的模型。
(1)研究者对所研究问题的相关理论了解不深 (2)研究者没有关注本领域前期的研究成果 (3)研究者在研究中缺乏相关数据 (4)数据测量时的误差
(1)遗漏相关变量:“过低拟合”模型(P165-P168)
实际模型:估计模型:
后果:
①如果遗漏变量X 3与模型中的变量X 2相关,则a 1和a 2是有偏的。也就是说,其均值或期望值与真实值不一致;
②a 1和a 2也是不一致的,即无论样本容量有多大,偏差也不会消失; ③如果X 2和X 3不相关,则b 32为零,即a 2是无偏的,同时也是一致的; ④根据两变量模型得到的误差方差是真实误差方差σ2的有偏估计量;
⑤此外,通常估计的a 2的方差
是真实估计量方差的有偏估计量。即使
等于零,这一方差仍然是有偏的;
⑥通常的置信区间和假设检验过程不再可靠。置信区间将会变宽,因此可能会“更频繁地”接受零假设:系数的真实值为零。 (2)包括不相关变量:“过度拟合”模型(P168-169)
正确模型:
错误模型:
后果:
①过度拟合模型的估计量是无偏的(也是一致的); ②从过度拟合方程得到的σ2的估计量是正确的;
③建立在t 检验和F 检验基础上的标准的置信区间和假设检验仍然是有效的;
④从过度拟合模型中估计的a 是无效的——其方差比真实模型中估计的b 的方差大。因此,建立在a 的标准误上的置信区间比建立在b 的标准误上的置信区间宽,尽管前者的假设检验是有效的。总之,从过度拟合模型中得到的OLS 估计量是线性无偏估计量,但不是最优先性无偏估计量。
(3)不正确的函数形式(P170-171)
如果选了错误的函数形式,则估计的系数可能是真实系数的有偏估计量。 (4)度量误差
①应变量中度量误差对回归结果的影响 i. OLS估计量是无偏的;
ii. OLS估计量的方差也是无偏的;
iii. 估计量的估计方差比没有度量误差时的大,因为应变量中的误差加入到了误差项中。
②解释变量的度量误差对回归结果的影响 i. OLS估计量是有偏的;
ii. OLS估计量也是不一致的。
③解决方法:如果解释变量中存在度量误差,建议使用工具变量或替代变量。
(1)诊断非相关变量(P172-P174)
(2)对遗漏变量和不正确函数形式的检验(P174-P175)
①判定系数R 2和校正后的R 2(
)。
②估计的t 值。
③与先验预期相比,估计系数的符号。
(3)在线性和对数线性模型之间选择:MWD 检验(P175-P176)
①设定如下假设。H 0:线性模型:Y 是X 的线性函数
H 1:对数线性模型:lnY 是X 或lnX 的线性函数
②估计线性模型,得到Y 的估计值
③估计线性对数模型,得到lnY 的估计值④求⑤做Y 对X 和⑥求
的回归,如果根据t 检验
的系数是统计显著的,则拒绝H0
⑦做lnY 对X 或lnX 和的回归,如果
的系数是统计显著的,则拒绝H 1
(4)回归误差设定检验:RESET (P177-P178)
①根据模型估计出Y 值 。
②把的高次幂,,等纳入模型以获取残差和之间的系统关系。由于上图表明残差和估计的Y 值之间可能存在曲线关系,因而考虑如下模型
③令从以上模型中得到的
为
,从前一个方程得到的是否是统计显著的。
为
,然后利用如
下F 检验判别从以上方程中增加的
④如果在所选的显著水平下计算的F值是统计显著的,则认为原始模型是错误设定的。
第八章 多重共线性:解释变量相关会有什么后果
回归模型的某个解释变量可以写成其他解释变量的线性组合。 设X 2可以写成其他某些解释变量的线性组合,即: X 2=a3X 3+a 4X 4„+a k X k
至少有一个a i ≠0, (i= 2,3,„k )称存在完全多重共线性
X 2与其他解释变量高度共线性,即可以近似写成其他解释变量的线性组合 X 2=a3X 3+a 4X 4 …+a k X k +i
至少有一个a i ≠0,(i= 2, 3,„k), vi 是随机误差项。
(1)时间序列解释变量受同一因素影响
经济发展、政治事件、偶然事件、时间趋势 经济变量的共同趋势
(2)模型设立:解释变量中含有当期和滞后变量
OLS 估计量仍然是最优无偏估计量
(1)在近似共线性的情形下,OLS 估计量仍然是无偏的; (2)近似共线性并未破坏OLS 估计量的最小方差性;
(3)即使在总体回归方程中变量X 之间不是线性相关的,但在某个样本中,X 变量之间可能线性相关。
(1)OLS 估计量的方差和标准误较大; (2)置信区间变宽; (3)t 值不显著; (4)R 2值较高;
(5)OLS 估计量及其标准误对数据的微小变化非常敏感 (6)回归系数符号有误;
(7)难以评估各个解释变量对回归平方和(ESS )或者R 2的贡献
(1)观察回归结果
R2较高,F 很大,但t 值显著的不多。(多重共线性的经典特征)
R2较高,F 检验拒绝零假设,但各变量的t 检验表明,没有(或少有)变量系数是统计显著的。
(2)简单相关系数法
解释变量两两高度相关。
变量相关系数比如超过0.8,则可能存在较为严重的共线性。 这一标准并不总是可靠,相关系数较低时,也有可能存在共线性 (3)检查偏相关系数(不一定可行) (4)判定系数法(辅助回归)
某个解释变量对其余的解释变量进行回归
如果判定系数很大,F 检验显著,即X i 与其他解释变量存在多重共线 (5)方差膨胀因子
(1)从模型中删除引起共线性的变量
①找出引起多重共线性的解释变量,将它排除出去(最为简单的克服多重共线性问题的方法)。
②逐步回归法 i. 逐步引入
如果拟合优度变化显著—新引入的变量是一个独立解释变量; 选择解释变量的原则:
a. 调整的R2增加, 每个∣t ∣增加, 则保留引入变量;
b. 调整的R2下降, 每个∣t ∣变化不大, 则删除引入变量;
ii. 逐步剔除
①排除变量时应该注意:
i. 由实际经济分析确定变量的相对重要性,删除不太重要的变量; ii. 如果删除变量不当,会导致模型设定误差。 (2)获取额外的数据或新的样本 (3)重新考虑模型 (4)先验信息 (5)变量变换
将原模型变换为差分模型
可有效消除存在于原模型中的多重共线性
一般,增量之间的线性关系远比总量之间的线性关系弱得多。
第九章 异方差:如果误差方差不是常数会有什么后果
随机误差项u i 的方差随着解释变量X i 的变化而变化,即:
OLS 估计仍是线性无偏,但不具最小方差 (1)线性性
(2)无偏性
(3)方差
式1不具有最小方差,式2具有最小方差
经典模型假定下,OLS 估计量是最优线性无偏估计量(BLUE )。 去掉同方差假定:
(1)OLS 估计量仍是线性的; (2)OLS 估计量仍是无偏的;
(3)OLS 估计量不再具有最小方差性,即不再是最优(有效)估计量。 (4)OLS 估计量的方差通常是有偏的;
(5)偏差的产生是由于,即
不再是真实σ2的无偏估计量;
(6)建立在t 分布和F 分布之上的置信区间和假设检验是不可靠的,如果沿用传统的检验方法,可能得出错误的结论。
(1)图形检验(P211-P212)
e 2对一个或多个解释变量或Y 的拟合值作图。 (2)帕克检验(Park Test)(P212-P214)
假定误差方差与解释变量相关形式:
步骤:
①做OLS 估计
②对e i 求平方,取对数 ③做辅助回归
④检验零假设:B 2=0
(3)格莱泽检验(Glejser Test)(P214)
假定误差方差与解释变量相关形式:
步骤:
①做OLS 估计 ②对e i 求绝对值 ③做辅助回归方程 ④检验零假设:B 2=0 (4)怀特检验(White Test)(P215-P216)
假定误差方差与X 、X 2和交叉乘积呈线性关系
步骤:
①OLS 估计得残差②做辅助回归③检验统计量
(1)加权最小二乘法WLS (Weighted Least Squares)(P217-P222)
①方差已知
原模型:
加权后的模型:误差项的方差为:1
加权的权数:
②方差未知
i. 误差方差与X i 成比例:
模型变换:
ii. 误差方差与Xi2成比例:
模型变换:
(2)怀特异方差校正的标准误(P222-P223)
①如果存在异方差,则对于通过OLS 得到的估计量不能进行t 检验和F 检验。 ②怀特估计方法
③大样本情形下回归标准差和回归系数的一致估计量,可以进行t 检验和F 检验。
第十章 自相关:如果误差项相关会有什么结果
按时间或空间顺序排列的观察值之间存在的相关关系。
(1)若古典线性回归模型中误差项ui 不存在自相关
Cov (ui ,uj )=E(ui ,uj )=0,i ≠j
(2)若误差项之间存在着依赖关系—ui 存在自相关
Cov (ui ,uj )=E(ui ,uj )≠0,i≠j
(1)惯性 (2)设定偏误
①模型中遗漏了重要变量。 ②模型选择了错误的函数形式。
i. 从不正确的模型中得到的残差会呈现自相关。
ii. 检验是否由于模型设定错误而导致残差自相关的方法: (3)蛛网现象
(4)数据的加工
①在用到季度数据的时间序列回归中,这些数据通常来自于每月数据。这种数据加工方式减弱了每月数据的波动而引进数据的匀滑性。
②用季度数据描绘的图形要比用月度数据看来匀滑得多。这种匀滑性本身可能使扰动项中出现自相关。
③内插法或外推法:用这些方法加工得到的数据都会给数据带来原始数据没有的系统性,这种系统性可能会造成误差自相关。
(1)OLS 估计得到的仍为线性、无偏估计; (2)OLS 估计不再具有有效性;
(3)OLS 估计量的方差有偏:低估了估计量的标准差; (4)通常所用的t 检验和F 检验是不可靠的;
(5)计算得到的误差方差是真实σ2的无偏估计量,并且很有可能低估
了真实的σ2;
(6)通常计算的R2不能测度真实的R2
(7)通常计算的预测方差和标准误也是无效的
(1)图形法—时序图(P237-P239)
①误差u t 并不频繁地改变符号,而是几个正之后跟着几个负,几个负之后跟着几个正,则呈正自相关。
②扰动项的估计值呈循环型,而是相继若干个正的以后跟着几个负的,表明存在正自相关。
③扰动项的估计值呈锯齿型(一个正接一个负),随时间逐次改变符号,表明存在负自相关。
(2)D.W 检验(P239-P242)
①定义
(1)ρ=1:一阶差分方法(P244)
假定误差项之间完全正相关
Y
t
=
α+βXt +u t u t = ut-1+t
Y t - Yt-1= β(X t -X t-1)+t
(2)从DW 统计量中估计ρ(P244-P245)
(3)从OLS 残差e t 中估计(Cochrane-Orcutt )(P245-P246)
①e t = et-1+t
②利用OLS 残差,得
的估计量
③迭代,得的收敛值