计量经济学课程实验
实验一 EViews软件的基本操作
【实验目的】
了解EViews软件的基本操作对象,掌握软件的基本操作。 【实验内容】
一、EViews软件的安装;
二、数据的输入、编辑与序列生成; 三、图形分析与描述统计分析; 四、数据文件的存贮、调用与转换。
实验内容中后三步以表1-1所列出的税收收入和国内生产总值的统计资料为例进行操作。
单位:亿元资料来源:《中国统计年鉴1999》
【实验步骤】
一、安装EViews软件 ㈠EViews对系统环境的要求
⒈一台386、486奔腾或其他芯片的计算机,运行Windows3.1、Windows9X、Windows2000、WindowsNT或WindowsXP操作系统;
⒉至少4MB内存;
⒊VGA、Super VGA显示器; ⒋鼠标、轨迹球或写字板; ⒌至少10MB以上的硬盘空间。 ㈡安装步骤
⒈点击“网上邻居”,进入服务器;
⒉在服务器上查找“计量经济软件”文件夹,双击其中的setup.exe,会出
现如图1-1所示的安装界面,直接点击next按钮即可继续安装;
⒊指定安装EViews软件的目录(默认为C:\EViews3,如图1-2所示),点击OK按钮后,一直点击next按钮即可;
⒋安装完毕之后,将EViews的启动设置成桌面快捷方式。
图1-1 安装界面
1
图1-2 安装界面2
二、数据的输入、编辑与序列生成 ㈠创建工作文件 ⒈菜单方式
启动EViews软件之后,进入EViews主窗口(如图1-3所示)。
图1-3 EViews主窗口
在主菜单上依次点击File/New/Workfile,即选择新建对象的类型为工作文件,将弹出一个对话框(如图1-4所示),由用户选择数据的时间频率(frequency)、起始期和终止期。
图1-4 工作文件对话框
其中, Annual——年度 Monthly——月度
Semi-annual——半年 Weekly——周 Quarterly——季度 Daily——日 Undated or irregular——非时序数据
选择时间频率为Annual(年度),再分别点击起始期栏(Start date)和终止期栏(End date),输入相应的日前1985和1998。然后点击OK按钮,将在EViews软件的主显示窗口显示相应的工作文件窗口(如图1-5所示)。
图1-5 工作文件窗口
工作文件窗口是EViews的子窗口,工作文件一开始其中就包含了两个对象,一个是系数向量C(保存估计系数用),另一个是残差序列RESID(实际值与拟合值之差)。
⒉命令方式
在EViews软件的命令窗口中直接键入CREATE命令,也可以建立工作文件。命令格式为:
CREATE 时间频率类型 起始期 终止期 则以上菜单方式过程可写为:CREATE A 1985 1998
㈡输入Y、X的数据 ⒈DATA命令方式
在EViews软件的命令窗口键入DATA命令,命令格式为: DATA „ 本例中可在命令窗口键入如下命令(图1-6所示): DATA Y X
将显示一个数组窗口(图1-7所示),此时可以按全屏幕编辑方式输入每个变量的统计资料。
图1-6 键入DATA命令
图1-7 数组窗口
⒉鼠标图形界面方式
在EViews软件主窗口或工作文件窗口点击Objects/New Object,对象类型选择Series,并给定序列名,一次只能创建一个新序列(图1-8所示)。再从工作文件目录中选取并双击所创建的新序列就可以展示该对象,选择Edit+/-,进入编辑状态,输入数据。
图1-8 创建新对象窗口
㈢生成log(Y)、log(X)、X^2、1/X、时间变量T等序列 在命令窗口中依次键入以下命令即可: GENR LOGY=LOG(Y) GENR LOGX=LOG(X) GENR X1=X^2 GENR X2=1/X GENR T=@TREND(84)
㈣选择若干变量构成数组,在数组中增加、更名变量
在工作文件窗口中单击所要选择的变量,按住Ctrl键不放,继续用鼠标选择要展示的变量,选择完以后,单击鼠标右键,在弹出的快捷菜单中点击Open/as Group(图1-9),则会弹出如图1-10所示的数组窗口,其中变量从左至右按在工作文件窗口中选择变量的顺序来排列。
图1-9 选择变量构成数组
图1-10 弹出的数组窗口
在数组窗口点击Edit+/-,进入全屏幕编辑状态,选择一个空列,点击标题栏,在编辑窗口输入变量名,再点击屏幕任意位置,即可增加一个新变量(图1-11所示)。
图1-11 在数组窗口增加变量
增加变量后,即可输入数据。点击要删除的变量列的标题栏,在编辑窗口输入新变量名,再点击屏幕任意位置,弹出RENAME对话框,点击YES按钮即可。(图1-12所示)。
图1-12 在数组窗口更名变量
㈤在工作文件窗口中删除、更名变量。
⒈在工作文件窗口中选取所要删除或更名的变量并单击鼠标右键,在弹出的快捷菜单中选择Delete(删除)或Rename(更名)即可(如图1-13所示)。
图1-13 在工作文件窗口删除、更名变量1
⒉在工作文件窗口中选取所要删除或更名的变量,点击工作文件窗口菜单栏中的Objects/Delete selected„(Rename selected„),即可删除(更名)变量(如图1-14所示)。
图1-14 在工作文件窗口删除、更名变量2
⒊在工作文件窗口中选取所要删除的变量,点击工作文件窗口菜单栏中的Delete按钮即可删除变量(如图1-15所示)。
图1-15 在工作文件窗口删除变量3
三、图形分析与描述统计分析 ㈠利用PLOT命令绘制趋势图 在命令窗口中键入:PLOT Y
则可以绘制变量Y的趋势图(图1-16)。
图1-16 变量Y的趋势图
从图1-16中可以看出,我国1985-1998年间税收收入是大体呈指数增长趋势的。
也可以利用PLOT命令将多个变量的变化趋势描绘在同一张图中,例如键入以下命令,可以观察变量Y、X的变化趋势(图1-17)。
PLOT Y X
图1-17 变量Y、X的趋势图
从图1-17中可以看出,我国1985-1998年间税收收入与GDP都大体呈指数增长趋势。
㈡利用SCAT命令绘制X、Y的相关图 在命令窗口中键入:SCAT X Y
则可以初步观察变量之间的相关程度与相关类型(图1-18)。
图1-18 变量X、Y相关图
图1-18表明,税收收入水平与GDP密切相关,税收收入水平随着GDP的增加而增加,两者大体呈线性变化趋势。
㈢观察图形参数的设置情况
双击图形区域中任意处或在图形窗口中点击Procs/Options(图1-19),则会弹出如图1-20所示的Graph Options窗口,进入图形编辑状态。选择图形类型、图形属性(是否置入图框内,刻度,是否用彩色)、柱和线的选项,设定竖轴(单个,双个,是否交叉),设定比例尺度(优化线性尺度,强制通过0线,对数尺度,正态化尺度),手动设定比例尺度、线形图选项、柱形图选项、散点图选项(连接,配拟合直线)、饼图选项等。
图1-19 在图形窗口选择Graph Options
图1-20 图形选项窗口
从图1-20中可以看出,本例中X、Y相关图使用散点图,且置入图框内,带有刻度与色彩,竖轴是单个刻度,比例尺度为优化线性尺度,散点图未连接,未配拟合直线,其余一些参数模式是自动设置的。
㈣在序列和数组窗口观察变量的描述统计量
若是单独序列窗口,从序列窗口菜单选择View/Descriptive Statistics/ Histogram and Stats,则会显示变量的描述统计量(图1-21)。
图1-21 单独变量序列描述统计量窗口
若是数组窗口,从数组窗口菜单选择View/Descriptive Stats/Individual Samples,就对每个序列计算描述统计量(图1-22)。
图1-22 数组描述统计量窗口
其中, Mean——均值 Median——中位数 Maximum——最大值
Minimum——最小值 Std.Dev.——标准差 Skewness——偏度 Kurtosis——峰度 Jarque-Bera—— Probability——概率 Observations——观测值个数 四、数据文件的存贮、调用与转换 ㈠存贮并调用工作文件 ⒈存贮
在Eviews主窗口的工具栏上选择File/Save(Save as),再在弹出的对话框中指定存贮路径,点击确定按钮即可。
⒉调用
在Eviews主窗口的工具栏上选择File/Open/Workfile,再在弹出的对话框中选取要调用的工作文件,点击确定按钮即可。
㈡存贮若干个变量,并在另一个工作文件中调用存贮的变量
在工作文件窗口中选取所要存贮的变量,点击工作文件窗口菜单栏中的Store按钮,弹出store对话框,指定存贮路径,点击YES按钮即可(图1-23)。
打开另一个工作文件,点击工作文件窗口菜单栏中的Fetch按钮,弹出fetch对话框,在指定目录下选取要调用的变量,点击确定按钮即可(图1-24)。
图1-23 Store 窗口
图1-24 Fetch窗口
㈢将工作文件分别存贮成文本文件和Excel文件
在工作文件窗口中选择要保存的一个或多个变量,点击Eviews主窗口菜单栏中的File/Export/Write Text-Lotus-Excel,在弹出的对话框中指定存贮路径和存贮的文件格式(图1-25),若存贮成文本文件则选择Text-ASCII,若存贮成Excel文件则选择Excel.xls,再点击保存按钮,弹出ASCII Text Export(Excel Export)窗口(图1-26),点击OK按钮即可。
其中,By Observation-Series in columns表示各观测值按列排列,By Series-Series in rows表示各观测值按行排列。
图1-25 指定存贮路径
图1-26 存贮为文本格式
㈣在工作文件中分别调用文本文件和Excel文件
点击Eviews主窗口菜单栏中的File/Import/Read Text-Lotus-Excel,在弹出的对话框中选取要调用的文本文件或Excel文件,点击打开按钮后,弹出ASCII Text Import(Excel Import)窗口(图1-27),在Name for series or Number of series if file names in file编辑框中要输入调用的变量名,点击OK按钮即可。
其中in columns表示按列调用数据,in rows表示按行调用数据。
图1-27 调用文本文件或Excel文件窗口
㈤在对象窗口中点击Name按钮,将对象存贮于工作文件。
以Y、X变量组成的数组为例,点击Name菜单,弹出object name对话框,在Name to identify object文本框中输入要命名的数组名称,点击OK按钮即可(图1-28)。
图1-28 存贮对象于工作文件
实验二 一元回归模型
【实验目的】
掌握一元线性、非线性回归模型的建模方法 【实验内容】
建立我国税收预测模型 【实验步骤】
【例1】建立我国税收预测模型。表1列出了我国1985-1998年间税收收入Y和国内生产总值(GDP)x的时间序列数据,请利用统计软件Eviews建立一元线性回归模型。
一、建立工作文件
⒈菜单方式
在录入和分析数据之前,应先创建一个工作文件(Workfile)。启动Eviews软件之后,在主菜单上依次点击File\New\Workfile(菜单选择方式如图1所示),将弹出一个对话框(如图2所示)。用户可以选择数据的时间频率(Frequency)、起始期和终止期。
图1 Eviews菜单方式创建工作文件示意图
图2 工作文件定义对话框
本例中选择时间频率为Annual(年度数据),在起始栏和终止栏分别输入相应的日期85和98。然后点击OK,在Eviews软件的主显示窗口将显示相应的工作文件窗口(如图3所示)。
图3 Eviews工作文件窗口
一个新建的工作文件窗口内只有2个对象(Object),分别为c(系数向量)和resid(残差)。它们当前的取值分别是0和NA(空值)。可以通过鼠标左键双击对象名打开该对象查看其数据,也可以用相同的方法查看工作文件窗口中其它对象的数值。
⒉命令方式
还可以用输入命令的方式建立工作文件。在Eviews软件的命令窗口中直接键入CREATE命令,其格式为:
CREATE 时间频率类型 起始期 终止期
本例应为:CREATE A 85 98 二、输入数据
在Eviews软件的命令窗口中键入数据输入/编辑命令:
DATA Y X
此时将显示一个数组窗口(如图4所示),即可以输入每个变量的数值
图4 Eviews数组窗口
三、图形分析
借助图形分析可以直观地观察经济变量的变动规律和相关关系,以便合理地确定模型的数学形式。 ⒈趋势图分析
命令格式:PLOT 变量1 变量2 ……变量K 作用:⑴分析经济变量的发展变化趋势
⑵观察是否存在异常值 本例为:PLOT Y X ⒉相关图分析
命令格式:SCAT 变量1 变量2 作用:⑴观察变量之间的相关程度
⑵观察变量之间的相关类型,即为线性相关还是曲线相关,曲线相关时大致是哪
种类型的曲线
说明:⑴SCAT命令中,第一个变量为横轴变量,一般取为解释变量;第二个变量为纵轴变量,一般取为被解释变量
⑵SCAT命令每次只能显示两个变量之间的相关图,若模型中含有多个解释变
量,可以逐个进行分析
⑶通过改变图形的类型,可以将趋势图转变为相关图 本例为:SCAT Y
X
图5 税收与GDP趋势图
图5、图6分别是我国税收与GDP时间序列趋势图和相关图分析结果。两变量趋势图
分析结果显示,我国税收收入与GDP二者存在差距逐渐增大的增长趋势。相关图分析显示,我国税收收入增长与GDP密切相关,二者为非线性的曲线相关关系。
图6 税收与GDP相关图
三、估计线性回归模型
在数组窗口中点击Proc\Make Equation,如果不需要重新确定方程中的变量或调整样本区间,可以直接点击OK进行估计。也可以在Eviews主窗口中点击Quick\Estimate Equation,在弹出的方程设定框(图7)内输入模型:
Y C X 或 YC(
1)C(2)X
图7 方程设定对话框
还可以通过在Eviews命令窗口中键入LS命令来估计模型,其命令格式为:
LS 被解释变量 C 解释变量
系统将弹出一个窗口来显示有关估计结果(如图8所示)。因此,我国税收模型的估计式为:
ˆ987.540.0946x y
这个估计结果表明,GDP每增长1亿元,我国税收收入将增加0.09646亿元。
图8 我国税收预测模型的输出结果
五、估计非线性回归模型
由相关图分析可知,变量之间是非线性的曲线相关关系。因此,可初步将模型设定为指数函数模型、对数模型和二次函数模型并分别进行估计。
在Eviews命令窗口中分别键入以下命令命令来估计模型:
双对数函数模型:LS log(Y) C log(X) 对数函数模型:LS Y C log(X) 指数函数模型:LS log(Y) C X 二次函数模型:LS Y C X X^2
还可以采取菜单方式,在上述已经估计过的线性方程窗口中点击Estimate项,然后在弹出的方程定义窗口中依次输入上述模型(方法通线性方程的估计),其估计结果显示如图9、图10、图11图、12所示。
ˆ1.27040.6823lnx 双对数模型:lny
(3.8305) (21.0487)
F443.05 R20.9736 20.9714
对数模型:
ˆ26163.322985.92lnx y
(-8.3066) (9.6999)
F94.0875 R20.8869 20.8775
ˆ7.50862.07105x 指数模型:lny
(231.7463) (27.2685)
R20.9841 20.9828 F743.57
ˆ1645.70.0468x5.5810二次函数模型:y
(7.4918) (3.3422) (3.4806)
7
x2
R20.9918 20.9903 F661.78
图9 双对数模型回归结果
图10 对数模型回归结果
图11 指数模型回归结果
图12 二次函数模型回归结果
六、模型比较
四个模型的经济意义都比较合理,解释变量也都通过了T检验。但是从模型的拟合优度来看,二次函数模型的2值最大,其次为指数函数模型。因此,对这两个模型再做进一步比较。
在回归方程(以二次函数模型为例)窗口中点击View\Actual,Fitted,Residual\ Actual,Fitted,Residual Table(如图13),可以得到相应的残差分布表。
图13 回归方程残差分析菜单
上述两个回归模型的残差分别表分别如下(图14、图15)。比较两表可以发现,虽然二次函数模型总拟合误差较小,但其近期误差却比指数函数模型大。所以,如果所建立的模型是用于经济预测,则指数函数模型更加适合。
图14 二次函数回归模型残差分别表
图15 指数函数模型残差分布表
实验三 多元回归模型
【实验目的】
掌握建立多元回归模型和比较、筛选模型的方法。 【实验内容】
建立我国国有独立核算工业企业生产函数。根据生产函数理论,生产函数的基本形式为:Yft,L,K,。其中,L、K分别为生产过程中投入的劳动与资金,时间变量t反映技术进步的影响。表3-1列出了我国1978-1994年期间国有独立核算工业企业的有关统计资料;其中产出Y为工业总产值(可比价),L、K分别为年末职工人数和固定资产净值(可比价)。
表3-1 我国国有独立核算工业企业统计资料
资料来源:根据《中国统计年鉴-1995》和《中国工业经济年鉴-1995》计算整理
【实验步骤】
一、建立多元线性回归模型
㈠建立包括时间变量的三元线性回归模型; 在命令窗口依次键入以下命令即可: ⒈建立工作文件: CREATE A 78 94 ⒉输入统计资料: DATA Y L K ⒊生成时间变量t: GENR T=@TREND(77) ⒋建立回归模型: LS Y C T L K 则生产函数的估计结果及有关信息如图3-1所示。
图3-1 我国国有独立核算工业企业生产函数的估计结果 因此,我国国有独立工业企业的生产函数为:
ˆ675.3277.6789t0.6667L0.7764K (模型1) y
t=(-0.252) (0.672) (0.781) (7.433)
F1018.551 R20.9958 20.9948
模型的计算结果表明,我国国有独立核算工业企业的劳动力边际产出为0.6667,资金的边际产出为0.7764,技术进步的影响使工业总产值平均每年递增77.68亿元。回归系数的符号和数值是较为合理的。R20.9958,说明模型有很高的拟合优度,F检验也是高度显著的,说明职工人数L、资金K和时间变量t对工业总产值的总影响是显著的。从图3-1看出,解释变量资金K的t统计量值为7.433,表明资金对企业产出的影响是显著的。但是,模型中其他变量(包括常数项)的t统计量值都较小,未通过检验。因此,需要对以上三元线性回归模型做适当的调整,按照统计检验程序,一般应先剔除t统计量最小的变量(即时间变量)而重新建立模型。
㈡建立剔除时间变量的二元线性回归模型; 命令:LS Y C L K
则生产函数的估计结果及有关信息如图3-2所示。
图3-2 剔除时间变量后的估计结果
因此,我国国有独立工业企业的生产函数为:
ˆ2387.271.2085L0.8345K (模型2)y
t=(-2.922) (4.427) (14.533)
R20.9956 20.9950 F1589.953
从图3-2的结果看出,回归系数的符号和数值也是合理的。劳动力边际产出为1.2085,资金的边际产出为0.8345,表明这段时期劳动力投入的增加对我国国有独立核算工业企业的产出的影响最为明显。模型2的拟合优度较模型1并无多大变化,F检验也是高度显著的。这里,解释变量、常数项的t检验值都比较
大,显著性概率都小于0.05,因此模型2较模型1更为合理。
㈢建立非线性回归模型——C-D生产函数。
C-D生产函数为:YALKe,对于此类非线性函数,可以采用以下两种方式建立模型。
方式1:转化成线性模型进行估计; 在模型两端同时取对数,得:
lnylnAlnLlnK
在EViews软件的命令窗口中依次键入以下命令:
GENR LNY=log(Y) GENR LNL=log(L) GENR LNK=log(K) LS LNY C LNL LNK 则估计结果如图3-3所示。
图3-3 线性变换后的C-D生产函数估计结果
即可得到C-D生产函数的估计式为:
ˆ1.95130.6045lnL0.6737lnK (模型3) lny
t= (-1.172) (2.217) (9.310)
F1641.407 R20.9958 20.9951
ˆ0.1424L0.6045K0.6737 即:y
从模型3中看出,资本与劳动的产出弹性都是在0到1之间,模型的经济意义合理,而且拟合优度较模型2还略有提高,解释变量都通过了显著性检验。
方式2:迭代估计非线性模型,迭代过程中可以作如下控制: ⑴在工作文件窗口中双击序列C,输入参数的初始值; ⑵在方程描述框中点击Options,输入精度控制值。 控制过程:
①参数初值:0,0,0;迭代精度:10-3;
则生产函数的估计结果如图3-4所示。
图3-4 生产函数估计结果
此时,函数表达式为:
ˆ4721.97L1.01161K1.0317 (模型4)y
t=(0.313)(-2.023)(8.647)
R20.9840 20.9817
可以看出,模型4中劳动力弹性=-1.01161,资金的产出弹性=1.0317,很显然模型的经济意义不合理,因此,该模型不能用来描述经济变量间的关系。而且模型的拟合优度也有所下降,解释变量L的显著性检验也未通过,所以应舍弃该模型。
②参数初值:0,0,0;迭代精度:10-5;
图3-5 生产函数估计结果
从图3-5看出,将收敛的误差精度改为10-5后,迭代100次后仍报告不收敛,说明在使用迭代估计法时参数的初始值与误差精度或迭代次数设置不当,会直接影响模型的估计结果。
③参数初值:0,0,0;迭代精度:10-5,迭代次数1000;
图3-6 生产函数估计结果
此时,迭代953次后收敛,函数表达式为:
ˆ0.1450L0.6110K0.6649 (模型5)y
t=(0.581)(2.267)(10.486)
R20.9957 20.9950
从模型5中看出,资本与劳动的产出弹性都是在0到1之间,模型的经济意义合理,R20.9957,具有很高的拟合优度,解释变量都通过了显著性检验。将模型5与通过方式1所估计的模型3比较,可见两者是相当接近的。
④参数初值:1,1,1;迭代精度:10-5,迭代次数100;
图3-7 生产函数估计结果
此时,迭代14次后收敛,估计结果与模型5相同。
比较方式2的不同控制过程可见,迭代估计过程的收敛性及收敛速度与参数初始值的选取密切相关。若选取的初始值与参数真值比较接近,则收敛速度快;反之,则收敛速度慢甚至发散。因此,估计模型时最好依据参数的经济意义和有关先验信息,设定好参数的初始值。
二、比较、选择最佳模型
估计过程中,对每个模型检验以下内容,以便选择出一个最佳模型: ㈠回归系数的符号及数值是否合理; ㈡模型的更改是否提高了拟合优度; ㈢模型中各个解释变量是否显著; ㈣残差分布情况
以上比较模型的㈠、㈡、㈢步在步骤一中已有阐述,现分析步骤一中5个不同模型的残差分布情况。
分别在模型1~模型5的各方程窗口中点击View/Actual, Fitted, Residual/ Actual, Fitted, Residual Table(图3-8),可以得到各个模型相应的残差分布表(图3-9至图3-13)。
可以看出,模型4的残差在前段时期内连续取负值且不断增大,在接下来的一段时期又连续取正值,说明模型设定形式不当,估计过程出现了较大的偏差。而且,模型4的表达式也说明了模型的经济意义不合理,不能用于描述我国国有工业企业的生产情况,应舍弃此模型。
ˆ的虚线框内,且残差分别不存在明显模型1的各期残差中大多数都落在
的规律性。但是,由步骤一中的分析可知,模型1中除了解释变量K之外,其余变量均为通过变量显著性检验,因此,该模型也应舍弃。
模型2、模型3、模型5都具有合理的经济意义,都通过了t检验和F检验,拟合优度非常接近,理论上讲都可以描述资本、劳动的投入与产出的关系。但从图3-13看出,模型5的近期误差较大,因此也可以舍弃该模型。
最后将模型2与模型3比较发现,模型3的近期预测误差略小,拟合优度比模型2略有提高,因此可以选择模型2为我国国有工业企业生产函数。
图3-8 回归方程的残差分析
图3-9 模型1的残差分布
图3-10 模型2的残差分布
图3-11 模型3的残差分布
图3-12 模型4的残差分布
图3-13 模型5的残差分布
三、模型预测
假设估计的模型为一元线性回归模型。 1.样本期内预测
①利用样本数据估计方程,LS Y C X ,并保存方程;
②在方程窗口点击FORECAST按钮,在弹出的预测对话框中输入预测变量名,也即Y拟合值的变量名(被解释变量为Y,则软件默认的变量名是YF);
③关闭弹出的预测变量描述性统计分析界面,在工作文件窗口中即可发现新出现的预测变量YF。
2.外推预测
①先利用样本数据估计方程,LS Y C X ,并保存方程;
②修改数据区间和样本区间,将区间扩充到预测年份:鼠标放在工作文件窗口Range和sample位置,双击即可修改数据区间和样本区间;
【或者用命令】
修改数据区间: RANGE 起始期 终止期 扩充数据区间: EXPAND 起始期 终止期
(注:EXPAND这条命令只能增加数据区间,不能缩减)
调整样本区间: SMPL 起始期 终止期
③输入解释变量预测年份的数值,点击方程之前保存的方程窗口的FORECAST按钮进行预测,注意,此时预测的样本区间已经包含了扩充的年份;
④观察保存的预测变量,预测年份的被解释变量也已填充了数据,此即点预测结果。
实验四 异方差性
【实验目的】
掌握异方差性的检验及处理方法 【实验内容】
建立并检验我国制造业利润函数模型 【实验步骤】
【例1】表1列出了1998年我国主要制造工业销售收入与销售利润的统计资料,请利用统计软件Eviews建立我国制造业利润函数模型。
一、检验异方差性 ⒈图形分析检验
⑴观察销售利润(Y)与销售收入(X)的相关图(图1):SCAT X Y
图1 我国制造工业销售利润与销售收入相关图
从图中可以看出,随着销售收入的增加,销售利润的平均水平不断提高,但离散程度也逐步扩大。这说明变量之间可能存在递增的异方差性。
⑵残差分析
首先将数据排序(命令格式为:SORT 解释变量),然后建立回归方程。在方程窗口中点击Resids按钮就可以得到模型的残差分布图(或建立方程后在Eviews工作文件窗口中点击resid对象来观察)。
图2 我国制造业销售利润回归模型残差分布
图2显示回归方程的残差分布有明显的扩大趋势,即表明存在异方差性。 ⒉Goldfeld-Quant检验
⑴将样本安解释变量排序(SORT X)并分成两部分(分别有1到10共11个样本合19到28共10个样本)
⑵利用样本1建立回归模型1(回归结果如图3),其残差平方和为2579.587。
SMPL 1 10 LS Y C
X
图3 样本1回归结果
⑶利用样本2建立回归模型2(回归结果如图4),其残差平方和为63769.67。
SMPL 19 28 LS Y C
X
图4 样本2回归结果
⑷计算F统计量:FRSS2/RSS1=63769.67/2579.59=24.72,RSS1和RSS2分别是模型1和模型2的残差平方和。
取
0.05
时,查F分布表得
F0.05(1011,1011)3.44,而
F24.72F0.053.44,所以存在异方差性
⒊White检验
⑴建立回归模型:LS Y C X,回归结果如图5。
图5 我国制造业销售利润回归模型
⑵在方程窗口上点击View\Residual\Test\White Heteroskedastcity,检验结果如图6。
图6 White检验结果
其中F值为辅助回归模型的F统计量值。取显著水平
0.05,由于
02.05(2)5.99nR26.2704,所以存在异方差性。实际应用中可以直接观察相伴概率
p值的大小,若p值较小,则认为存在异方差性。反之,则认为不存在异方差性。 ⒋Park检验
⑴建立回归模型(结果同图5所示)。
⑵生成新变量序列:GENR LNE2=log(RESID^2)
GENR LNX=log
⑶建立新残差序列对解释变量的回归模型:LS LNE2 C LNX,回归结果如图7所示。
图7 Park检验回归模型
从图7所示的回归结果中可以看出,LNX的系数估计值不为0且能通过显著性检验,即随即误差项的方差与解释变量存在较强的相关关系,即认为存在异方差性。 ⒌Gleiser检验(Gleiser检验与Park检验原理相同) ⑴建立回归模型(结果同图5所示)。
⑵生成新变量序列:GENR E=ABS(RESID)
⑶分别建立新残差序列(E)对各解释变量(X/X^2/X^(1/2)/X^(-1)/ X^(-2)/ X^(-1/2))的回归模型:LS E C X,回归结果如图8、9、10、11、12、13所示。
图
8
图
9
图10
图
11
图
12
图13
由上述各回归结果可知,各回归模型中解释变量的系数估计值显著不为0且均能通过显著性检验。所以认为存在异方差性。 ⑷由F值或R确定异方差类型
Gleiser检验中可以通过F值或R值确定异方差的具体形式。本例中,图10所示的回归方程F值(R)最大,可以据次来确定异方差的形式。 二、调整异方差性 ⒈确定权数变量
根据Park检验生成权数变量:GENR W1=1/X^1.6743
2
2
2
根据Gleiser检验生成权数变量:GENR W2=1/X^0.5 另外生成:GENR W3=1/ABS(RESID)
GENR W4=1/ RESID ^2
⒉利用加权最小二乘法估计模型
在Eviews命令窗口中依次键入命令:
LS(W=Wi) Y C X
或在方程窗口中点击Estimate\Option按钮,并在权数变量栏里依次输入W1、W2、W3、W4,回归结果图14、15、16、17所示。
图
14
图15
图
16
图17
⒊对所估计的模型再进行White检验,观察异方差的调整情况
对所估计的模型再进行White检验,其结果分别对应图14、15、16、17的回归模型(如图18、19、20、21所示)。图18、19、21所对应的White检验显示,P值较大,所以接收不存在异方差的原假设,即认为已经消除了回归模型的异方差性。图20对应的White检验没有显示F值和nR的值,这表示异方差性已经得到很好的解决。
2
图18
图
19
图
20
图21
实验五 自相关性
【实验目的】
掌握自相关性的检验与处理方法。 【实验内容】
表5-1列出了我国城乡居民储蓄存款年底余额(单位:亿元)和国内生产总值指数(1978年=100)的历年统计资料,试建立我国城乡居民储蓄存款模型,并检验模型的自相关性。
资料来源:《中国统计年鉴1999》
【实验步骤】
一、回归模型的筛选 ⒈相关图分析:SCAT X Y
存款余额为被解释变量Y,GDP指数为解释变量X,可得到二者的相关关系图如5-1所示。
图5-1表明随着GDP指数的上升,居民储蓄存款也逐步增加,二者的曲线相关关系较为明显,线性关系则不太明显。因此,为了合理估计居民储蓄存款模型,可以将函数初步设定为线性、双对数、对数、指数、二次多项式等不同形式,进而加以比较分析。
图5-1 我国城乡居民储蓄存款与GDP指数相关图
⒉估计模型,利用LS命令分别建立以下模型 ⑴线性模型: LS Y C X
由此得到估计结果及相关信息如图5-2所示。
图5-2 线性模型估计结果
其检验报告如下:
ˆ14984.8492.5075x y
t (-6.706) (13.862)
R2=0.9100 F=192.145 S.E=5030.809 ⑵双对数模型:GENR LNY=LOG(Y) GENR LNX=LOG(X) LS LNY C LNX 估计结果及相关信息如图5-3所示。
图5-3 双对数模型估计结果
其检验报告如下:
ˆ8.07532.9588lnx lny
t (-31.604) (64.189)
R2=0.9954 F=4120.223 S.E=0.1221 ⑶对数模型:LS Y C LNX 估计结果及相关信息如图5-4所示。
图5-4 对数模型估计结果
其检验报告如下:
ˆ118140.823605.82lnx y
t (-6.501) (7.200)
R2=0.7318 F=51.8455 S.E=8685.043 ⑷指数模型:LS LNY C X 估计结果及相关信息如图5-5所示。
图5-5 指数模型估计结果
其检验报告如下:
ˆ5.31850.010005x lny
t (23.716) (14.939)
R2=0.9215 F=223.166 S.E=0.5049 ⑸二次多项式模型:GENR X2=X^2
LS Y C X X2
估计结果及相关信息如图5-6所示。
图5-6 二次多项式模型估计结果
其检验报告如下:
ˆ2944.5644.5485x0.1966x2 y
t (3.747) (-8.235) (25.886)
R2=0.9976 F=3814.274 S.E=835.979 ⒊选择模型
比较以上模型,可见各模型回归系数的符号及数值较为合理。各解释变量及常数项都通过了t检验,模型都较为显著。除了对数模型的拟合优度较低外,其余模型都具有高拟合优度,因此可以首先剔除对数模型。各模型的残差分布表如图5-7至图5-10所示。
图5-7 线性模型残差分布
图5-8 双对数模型残差分布
图5-9 指数模型残差分布
图5-10 二次多项式模型残差分布
从以上残差分布表可见,线性模型的残差在较长时期内呈连续递减趋势而后又转为连续递增趋势,指数模型则大体相反,残差先呈连续递增趋势而后又转为连续递减趋势,因此,可以初步判断这两种函数形式设置是不当的。而且,这两个模型的拟合优度也较双对数模型和二次多项式模型低,所以又可舍弃线性模型和指数模型。双对数模型和二次多项式模型都具有很高的拟合优度,因而初步选定回归模型为这两个模型。
二、自相关性检验 ⒈DW检验; ⑴双对数模型
dU=1.42,因为n=21,k=1,取显著性水平=0.05时,查表得dL=1.22,
而0
⑵二次多项式模型
dL=1.22,dU=1.42,而dL
断是否存在自相关。
⒉偏相关系数检验
在方程窗口中点击View/Residual Test/Correlogram-Q-statistics,并输入滞后期为10,则会得到残差et与et1,et2,et10的各期相关系数和偏相关系数,如图5-11、5-12所示。
图5-11 双对数模型的偏相关系数检验
图5-12 二次多项式模型的偏相关系数检验
从5-11中可以看出,双对数模型的第1期、第2期偏相关系数的直方块超过了虚线部分,存在着一阶和二阶自相关。图5-12则表明二次多项式模型仅存在二阶自相关。
⒊BG检验
在方程窗口中点击View/Residual Test/Series Correlation LM Test,并选择滞后期为2,则会得到如图5-13所示的信息。
图5-13 双对数模型的BG检验
图中,nR2=11.31531,临界概率P=0.0034,因此辅助回归模型是显著的,即存在自相关性。又因为et1,et2的回归系数均显著地不为0,说明双对数模型存在一阶和二阶自相关性。
二次多项式BG检验
BG检验与偏相关系数检验结果不同
三、自相关性的调整:加入AR项 ⒈对双对数模型进行调整;
在LS命令中加上AR(1)和AR(2),使用迭代估计法估计模型。键入命令: LS LNY C LNX AR(1) AR(2) 则估计结果如图5-16所示。
图5-16 加入AR项的双对数模型估计结果
2的估计值分别为0.94591, 图5-16表明,估计过程经过4次迭代后收敛;