自相关函数可用来考察一个序列中是否存在趋势。如果一个时间序列的ACF缓慢递减趋于0,这说明这个时间序列可能有一个较大的特征根、或是一个单位根过程或是趋势平稳过程。可用正规的统计检验来确定一个系统是否有趋势,这趋势是确定的还是随机的。但是,目前所有的检验在区分近似单位根过程与单位根过程时,功效都比较低。为此,本章将介绍下面五个问题: (1)对于均值依赖于时间的变量,趋势可以是确定性的,也可以包含随机成分。在假设检验或长期预测时,正确模拟这个趋势是致关重要的。 (2) 说明Dickey-Fuller的单位根检验和扩展的Dickey-Fuller的单位根检验。这些检验也可用来帮助检测随机趋势的存在。给出几种检验的形式(包括季节单位根检验)。为了详述这些统计量,必须了解Monte Carlo实验。
(3)考虑存在结构性变化时的单位根
检验。结构性变化可使趋势检验变得复杂;政治的变化可导致结构性变化,使一个平稳序列显示出非平稳性。
(4)给出检验一个序列是否包含一个单位根的一般方法。单位根检验对确定性回归变量(如,截距项,确定性时间趋势项)的存在非常敏感。对此,有一个比较合理的程序来识别这个过程。如果不知道真实的数据生成过程是否包含确定性部分时,就可以使用这些程序。不过,对这些检验结果也还是需要慎重一些,因为(a)这些检验在区分单位根过程和拟单位根过程时有较低的功效。(b)也许会出现对确定性回归变量的设定不适当。
(5)把一个具有趋势的序列分解成平稳和趋势成分。给出把一个序列分解成暂时部分和持久部分的几种方法。
1 确定性趋势和随机趋势
通常需要把一个线性随机差分方程的一般解表示成下面三个不同部分
yt= 趋势 + 平稳成分 + 噪声 在第2章我们已经知道如何利用Box-Jenkins方法来对平稳成分进行建模。第3章已经知道如何对残差(噪声)的方差进行建模。计量经济学家的重要任务是研究出简单的随机差分方程模型来模拟具有趋势变量的行为。考察图4-1,实际GDPrgdp的明显特征是随着时间而增加。对这个序列,也许有人用下面多项式估计这个趋势的持续增加:
trgdpt2.2240.385t0.0003t1.85E6t
23 (61.27)(20.)(-6.78)(12.17)
(4.1.1)
600050004000300020001000505560657075GDP80859095 图4.1 实际GDP是确定性趋势吗? 尽管t-统计量是显著的,但用这个模型表示实际GDP的趋势是有问题的。由于在
这个趋势中,没有随机成分,(4.1.1)说明实际经济有确定性的长期增长率。“实际经济周期”学派认为技术进步对经济的趋势有长期效应。由于技术革新是随机的,趋势中应反映这种随机性。其它宏观经济学派也认为趋势并不完全是确定性。例如,石油价格冲击或减税可以影响投资和经济的长期增长率。
联邦基金利率和美国联邦10年期债券收益率在图4.2中。两种利率没有明显的增加或减少的趋势。没有结构性间断使均值发生改变。两个序列没有返回到长期均值的趋势。趋势的关键特征是:趋势对序列有持久效应。如果把趋势定义为一个序列的“持久”或“不衰减”的成分,那么这两个序列都有趋势。
如果一个序列从某期到下期总是变化相同固定的数量,如 yta0 这个差分方程的解为 yty0a0t
因此,yta0的解是一个确定性线性趋势,现在如果把平稳成分A(L)增加到到这个趋势中,有
t yty0a0tA(L)t (4.1.2)
(联邦基金利率) (某种债券收益)
2016141212108841960196519701975FF198019851960196519701975AAA19801985160
图4.2 短期和长期利率
在(4.1.2)中,y可以偏离它的趋势值大约A(L)t。这个偏差是平稳的,yt是暂时偏离这个趋势。y的长期预报将收敛到y0a0(ts)。这类模型被称为趋势平稳(TS)模型。
现在假设y的预期变化是a单位,令y等于a加上白噪声:
ttst0t0 yta0t
(4.1.3)
由于Et1t0,(4.1.3)说明:yt由一个时期到下一个时期的预期变化是a0单位。在这种情况下,(4.1.3)中yt的趋势与(4.1.2)中y的趋势有本质的不同。若y是初值条件,差分方程(4.1.3)的解为
t0ia0t yty0i1t含有确定性趋势成分a0t和成分
y0i。我们称第二个成分为随机截距项。在没有任何冲击的条件下,截距项为y。但是,每个冲击i都使截距项有一个平移。由于i的所有系数都为1,每个对截距项的冲击效应都是持久的。这种序列被称为随机趋势。
随机游动模型
模型(4.1.3)是模拟包含随机趋势的时间序列的基本模型。下面详细分析随机趋势的性质。在(4.1.3)中,a0时称为随机游动模型,它在经济与金融文献中有特殊的地位。例如,“有效市场”假说认为:股票价这里
yt00格从一天到下一天的变化是一个随机游动,所以
ytyt1t (或ytt)
(4.1.4)
如果y是初始条件,则这个随机游动的解
0
yty0i
i1t取期望,EytEytsy0。所以,随机游动的均值是常量。但,所有对y的随机冲击有非减的效应。
ttiyt EtytsytEti1s对给定的s,y的条件期望都相等。所以,y的
无偏估计是y。由于冲击对y有持久影响,在预测y时,反映了这个持久性。容易证明方差与时间有关
tststttts Var(yt)t,
2Var(y)(ts) ts2时,方差也趋于无穷。所以,随机游走
散满无序,不显示出任何增大或减小的趋
t势。容易计算出相关系数
tss t
对于前几个自相关系数(s较小时),近似
等于1。随着s得增加,的值逐渐变小。因此,随机游走过程的自相关函数显示出较缓慢趋于零的特征。所以可用自相关函数来区分单位根过程和自回归系数近似1的平稳过程。
带漂移项的随机游动模型
现在令y的变化一部分是确定性的,一部分是随机的
sst ytyt1a0t
因此,(4.1.3)是随机游动加漂移项。给定初始条件y,y的一般解为
0ti yty0a0ti1t(4.1.5)
这时y的时间路径由两个非平稳成分所支配:线性确定性时间趋势a0t和随机趋势t。在大样本中,渐近理论认为yt的时间
t路径由确定性时间趋势at所支配。但是,不能由此认为可以容易分辨随机游动模型和带漂移项的随机游动模型。因为,在小样本中,增大的方差或减小a的绝对值就会很难分辨序列的长期特性。这时带有漂移项的随机游动和趋势平稳序列(TS)就会非常相似。
一般的随机趋势模型
为了考虑更一般的情形,不难把随机游动模型推广成y是随机趋势与一个白噪声之和,称为随机游动加噪声:
0t0tyyt0it i1t(4.1.6)
这里,是白噪声,方差为,和是的(E()0)。
随机游动加噪声的另一种表示是
2tttstts yttt (4.1.7)
由(4.1.6)可以看到随机游动加噪声模型的重要性质:
1 给定y值,序列y的均值是常量:
0t对y的冲击有持久效应,所以y有随机趋势成分。
2 {y}有纯噪声成分,对{y}只有暂时效应,的现期值只影响y,但不影响后期值y。
22Var(y)t3 {y}的方差不是常数,t,
且Var(yts)(ts)22,当t,y的方差趋于无穷。噪声成分的存在意味着y和y的相关系数小于纯随机游动的系数。这是因为
2Cov(y,y)(ts) ttsEyty0,ttttttttttstttts
2ss22 (t2)[(ts)2](ts)2对于0,将与纯随机游动的相关系数比
较,可知随机游动加噪声模型的相关系数小于纯随机游动的相关系数。
随机游动加噪声模型和随机游动加漂移项是构造更复杂的时间序列模型的基本模型。很容易将噪声和漂移项合并到一个模型中,如,将(4.1.6)或(4.1.7)变成下面形式
yta0tt
yyatt00it (4.1.8) 或 i1t 方程(4.1.8)称为趋势加噪声模型,y是
确定性趋势、随机趋势和纯白噪声之和。而且噪声序列也不一定是白噪声序列。也可以把带漂移的随机游动增加平稳过程A(L),这样得到了被称为带有不规则成分得一般趋势模型:
tt
yty0a0tiA(L)t
i1t (4.1.9)
因此,(4.1.9)有确定性趋势,随机趋势和
平稳成分。
2 去掉趋势
由上节,我们知道一个具有趋势的序列和一个平稳序列的重要差别。对平稳序列的冲击效应是暂时的,随时间的推移,冲击效应将消散,序列将返回到长期均值水平。 另一方面,含有趋势的序列将不会返回到长期水平。趋势有确定性因素和随机性成分。可以进行适当的变换来消除趋势部分,将其变换成平稳序列,这有着重要的意义。
消除趋势的通常方法是差分和去趋势。去趋势需要把这个变量对时间回归求出残差(去趋势是去掉确定性趋势而不是随机趋势)。包含一个单位根的序列可通过差分达到平稳。事实上,我们已经知道ARIMA(p,d,q)的d次差分是平稳的。本节的目的是比较去掉趋势的这两种方法。 差分
首先考虑带漂移项的随机游动模型的解
i yty0a0ti1t取差分,得yta0t。这时差分后的序列y是
平稳的,因为 E(yt)a0
222Var(y)E(ya)E tt0tt Cov(yt,yts)E(tts)0 再考虑随机游动加噪声模型,取差分
后,yttt,这时差分后的序列y也是平稳的:
22Var(y)2 E(yt)0,t 2Cov(y,y) tt1
t Cov(yt,yts)0,s1 考虑ARIMA(p,d,q)模型
A(L)ytB(L)t (4.2.1)
A(L)和B(L)是p阶,q阶的滞后算子L的多项式。
假设A(L)有一个单位根,B(L)所有根
在单位圆外。可将A(L)分解为(1L)A(L),A(L)是p-1阶多项式,根在单位圆外。
(1LA)L(yt)BLt ((4.2.2)
ty令tyt,有
A(L)yB(L)t (4.2.3)
所以y是平稳序列。如果A(L)有两个单位根,可用上方同样的方法来说明y的2阶差分是平稳序列。 一个有d个单位根的过程,经过d次差分后,变成平稳序列。一个ARIMA(p,d,q) 过程,有d个单位根,经过d次差分后,变成平稳ARMA(p,q)序列。这样的序列是d阶单整的,用I(d)表示。
tt 去趋势
我们已经知道,差分有时可以将非平稳模型变换成具有ARMA表示的平稳模型。这并不是说,所有的非平稳模型都可以通过适当的差分变成平稳的ARMA模型。例如,考虑一个具有确定性趋势和噪声的模型。 yty0a1tt 一阶差分是 yta1tt1 这里yt是不可逆的(即yt不能表达成自回归的形式)。因为一个平稳过程是可逆的,只须MA部分没有单位根。所以,yt不能表示成平稳的ARMA模型。
另一种方法是去趋势,即估计回归方程
yta0a1tt,从观测到的序列中减去yt的这个估计值,得到t的估计值。更一般地,一个时间序列可以有多项式趋势:
yta0a1ta2ta3tantet
这里et是一个平稳过程。
23n 通过把yt对一个确定性多项式的时间趋势回归来去趋势。多项式的阶数可通过t-检验,F-检验或AIC,SBC来确定。在实际中通过使用最大的n值估计这个回归方程,若an的t-统计量为0,考虑阶为n-1的多项式趋势。F-统计量可用来确定一组系数(如
ani,,an)是否异于零。AIC,SBC可用来
证实多项式适当的阶数。
yt的估计值与实际值的差就是平稳序列
et的估计值,被去掉趋势后的过程可以用
传统的方法(如ARMA估计)来建模。
差分平稳和趋势平稳模型
我们有两种方式消除趋势。一个趋势平稳过程可以通过去掉确定性趋势而转化为平稳序列。一个具有单位根的过程,(称为差分平稳序列DS)可通过差分而转化为平稳序列。当使用不适当的方法消除趋势时,可产生严重的问题。我们已经看到,试图把方程yty0a1tt差分后所引起的问题。对一个更一般的趋势平稳过程
A(L)yta0a1tet 这里A(L)的特征根在单位圆外,e可有eB(L)形式。如果减去确定性时间趋势的估计值会得到一个平稳可逆的ARMA模型。但如果我们把模型进行一阶差分,会得
A(L)y ta1(1L)B(L)t
这说明,把趋势平稳(TS)过程进行一阶差分,会使模型中的MA部分加入了一个不可逆的单位根过程。所以,y不能表示成平稳的ARMA过程。
同样地,从差分平稳过程中减去确定性时间趋势也是不适当的。如,在(4.1.9)中,从每个观测值中减去y0a0t并不能得到平稳序列,因为趋势中的随机部分没被消除。
经济周期
在传统的经济周期的研究中,总是将实际宏观经济变量分解为长期趋势和周期部分。典型的分解见图4.4。长期趋势属于增长理论范畴。趋势的斜率是由长期要素,如技术进步,生产力,教育达到的水平而决定。
tttt实际经济这种波浪式的运动称为经济周期。虽然循环期不一定象图中那么正规,繁荣、衰退期象潮汐一样可循环。货币和财政的目的是降低周期的振幅。趋势是不平稳部分,周期和不规则部分是平稳部分。
图4.4
虽然有衰退、繁荣期,二战后的经验告诉我们,经济周期并没有规则的周期。即使如此,人们也相信,长期来看,宏观经济变量以常量趋势增长,偏离这个趋势的偏差最终由“看不见的手”而消除。“趋势不变”的观点导致人们使用线性(或多项式)确定性回归方程来去掉宏观经济数据中的趋势。 然而,Nelson和Plosser(1982)认为,重要的宏观经济变量的趋势是DS而不是TS过程。他们得到了13个重要宏观经济变量的数据:实际GNP、名义GNP、工业产值、
就业、失业率、GNP通胀指数、消费价格、工资、实际工资、货币纯量、流通速度、债券收益、股票价格指数。他们的结果列在表4.1中,前两列是一阶二阶自相关。前三个序列的一阶自相关建议:序列存在单位根。虽然失业的一阶自相关是0.75,但二阶自相关小于0.5。
一阶差分后的序列的一阶,二阶自相关是r(1)、r(2)。一阶差分的样本自相关建议:一阶差分后的序列是平稳的。支持了数据是DS过程。Nelson和Plosser指出:差分后的实际、名义GNP的一阶正自相关建议了MA(1)过程。为了进一步断定这些过程是DS过程,差分这个DS过程应得到一个不可逆的运动平均过程。差分后的序列在MA项中似乎都没有单位根。
通过去掉线性趋势后得到一个序列,计算它的残差的样本自相关,于表中最后两列。去掉趋势后的样本自相关的值仍较大。这说明:将差分平稳序列(DS)去趋势,没有消除非平稳性。这说明宏观经济变量并不以光滑的长期增长率来增长。一些宏观经济冲击
1是持久的,这些冲击效应没被消除。 自相关(Nelson和Plosser) 1 2 r(1) r(2) d(1) d(2) 实际GNP 名义GNP 工业产值 失业率 .95 .95 .97 .75 .90 . .94 .47 .34 .44 .03 .09 .04 .08 .87 .93 .66 .79 .67 .46 -.11 .84 -.29 .75 注:i,r(i),d(i)分别是序列本身,一阶差分后的序列,去趋势后的序列的i阶自相关。
实际GDP中的趋势
在图4.1中我们看到了实际GDP中有一个明显的趋势。但模型(4.1.1)的残差的ACF和PACF的结果列在图4.5(a)中,可以看到ACF缓慢趋于零,但PACF在一阶滞后处截尾。ACF缓慢趋于零说明这个序列也许有随机趋势。因此去趋势似乎不能得到平
稳序列。图4.5(b)中显示了实际GDP对数的差分后的ACF
图(a)
4.5
图(b)
和PACF。2步滞后以后,所有ACF,PACF都统计上显著为零。实际GDP对数变化的模型的估计是:
lrgdpt0.00500.256lrgdpt10.1496lrgdpt2 (5.03) (3.30) (1.94) 这个模型的残差是白噪声。所以,差分可以消除这个趋势。
4.5
3 单位根和回归残差 考虑回归方程
yta0a1ztet
(4.3.1)
传统回归模型的假设要求y和z都是平稳的且误差有零均值、有限的方差。但在非平稳变量存在的情况下,Granger和Newbold(1974)认为:可能出现伪回归。一个伪回归可以有较高的R,t-统计量也是显著的,但结果没有任何经济意义。回归结果似乎很好,但由于OLS估计不是一致的,统计检验和推断并不成立。Granger和Newbold(1974)详细分析了不满足平稳性条件所带来的后果。令y和z是的随机游动
ytyt1yt (4.3.2)
ztzt1zt (4.3.3)
tt2tt和是两个白噪声,相互。
如果(4.3.1)的残差e是非平稳的,回归方程(4.3.1)肯定无意义。显然,如果e有随机趋势,误差就不会趋于零,使任何偏差都是持久的。有持久误差的经济模型是无意义的。检验e的最简单的方法是去掉截距项a,有
ytztttt0 etyta1zt
如果y,z是由(4.3.2),(4.3.3)生成,令
tty0z00,则有
yia1zi eti1i1tt这个误差的方差是无穷大,这不满足通常的假设检验条件,使得t-检验,F-检验或R值都是不可靠的。可以证明:随着t的增加,e和e之间的相关系数趋于1。 在零假设a=0下,(4.3.1)成为yae。如果y是一阶单整序列,那么,在零假设下,e也是单整序列。误差项有单位根,所以也不能采用OLS估计法。即使在大样本情况下,也存在这样问题。事实上,Phillips(1986)
2tt1
1t0ttt证明,在大样本情况下,更有可能得出a0的错误结论。
4 Dickey-Fuller检验
1 在模型ytyt1t中确定是否为1是
y检验t是否有一个单位根的简单方法。两
边同时减去yt1,有ytyt1t,检验假
设=1等价于检验0。Dickey-Fuller(1979)考虑了三种不同形式的回归方程用来检验单位根的存在:
ytyt1t (4.4.1)
yta0yt1t
(4.4.2)
yta0a1tyt1t (4.4.3)
三个方程的不同之处在于确定性成分a0,a1t的存在。最重要的参数是,如果0,
yt包含一个单位根。利用最小二乘法估计
一个或多个上方方程,来获得的估计和标准差。比较t-统计量值与报告在Dickey-Fuller临界值表中的值,然后确定是接受还是拒绝零假设0。
不管使用哪种形式的方程,程序都是相同的。但t-统计量的值依赖于包含在方程中的截距项、时间趋势项。Dickey-Fuller(1979)在Monte Carto研究中,发现对0的临界值依赖于回归方程的形式和样本大小。对方程(4.4.1),(4.4.2),(4.4.3)合适的统计量是,,。
表A,的累积分布 样本数 0.01 0.025 0.05 0.01 无常数和趋势(aa0) 25 -2.66 -2.26 -1.95 -1.60 50 -2.62 -2.25 -1.95 -1.61 100 -2.60 -2.24 -1.95 -1.61 250 -2.58 -2.23 -1.95 -1.62 300 -2.58 -2.23 -1.95 -1.62 -2.58 -2.23 -1.95 -1.62 有常数但无趋势(a0) 01125 50 100 250 500 -3.75 -3.33 -3.00 -2.62 -3.58 -3.22 -2.93 -2.60 -3.51 -3.17 -2. -2.58 -3.46 -3.14 -2.88 -2.57 -3.44 -3.13 -2.87 -2.57 -3.43 -3.12 -2.86 -2.57 有常数和趋势 25 -4.38 -3.95 -3.60 -3.24 50 -4.15 -3.80 -3.50 -3.18 100 -4.04 -3.73 -3.45 -3.15 250 -3.99 -3.69 -3.43 -3.13 500 -3.98 -3.68 -3.42 -3.13 -3.96 -3.66 -3.41 -3.12
对100个观测值,对0的t-统计量有三个不同的临界值。没有截距和时间趋势项(aa0)的回归使用标有的部分,在10%,5%,1%的显著水平上,t-统计量的临界值分别为-1.61,-1.95,-2.60。注意临界值依赖于样本大小。像大多数假设检验一样,对给定的显著水平,t-统计量的临界值随着样本大小的增加而增加。
01包含截距项但没有趋势项(a0)的回归方程,使用标有的临界值。10%,5%,1%的显著水平下,临界值分别为-2.58,-2.,-3.51。包含截距项和趋势项的回归方程,使用标有的临界值。5%,1%的显著水平下,临界值分别为-3.45,-4.04。 如果回归方程(4.4.1),(4.4.2),(4.4.3)分别由下面方程
1iyti1t ytyt1i2p(4.4.4)
ty10 ytai2pit1iy t
(4.4.5)
yta1atty01i2piti1y t
(4.4.6)
所代替,其临界值仍不变。
Dickey-Fuller(1981)给出另外3个F-统计量(,,)来检验系数的联合假设。利用方程(4.4.2)或(4.4.5),可用统计量检验零假设a0。包含时间趋势的回归(4.4.3)
12310或(4.4.6),可用检验联合假设aa0,可用检验联合假设a0。
,,统计量的构造与通常F-检验相同:
20131123()-SSR(无)]/r [SSR SSR(无)/(T-k)i这里,SSR()和SSR(无)是从和无模型中得到的残差平方和。r=条件个数,T=观测值的个数,k=无模型中待估计的参数个数。因此,T-k=无模型的自由度。
将的值与Dickey-Fuller(1981)给出的临界值作比较。零假设H:“数据是由模型生成”,备择假设H:“数据是由无模型生成”。如果条件不成立,SSR()和SSR(无)应该很接近,应该较小。所以,的较大值说明条件应成立,拒绝零假设。因此,如果的值小于Dickey和Fuller给出的临界值,可以接受模型。三个统计量的临界值在表B中给出。
表B 样本数 0.10 0.05 0.025 0.01 i01iiii125 50 100 250 500 25 50 100 250 500 25 50 100 250 500 4.12 3.94 3.86 3.81 3.79 3.78 4.67 4.31 4.16 4.07 4.05 4.03 5.91 5.61 5.47 5.39 5.36 5.34 5.18 4.86 4.71 4.63 4.61 4.59 5.68 5.13 4.88 4.75 4.71 4.68 7.24 6.73 6.49 6.34 6.30 6.25 6.30 5.80 5.57 5.45 5.41 5.38 6.75 5.94 5.59 5.40 5.35 5.30 8.65 7.81 7.44 7.25 7.20 7.16 7.88 7.06 6.70 6.52 6.47 6.43 28.21 7.02 6.50 6.22 6.15 6.09 310.61 9.31 8.73 8.43 8.34 8.27
对样本大小为100的检验统计量和临界
值在表4.2中给出:
表4.2 Dickey-Fuller检验的临界值 模型 假设 检验95%的99%置统计临界信区量 值 间 yaaty 0 -3.45 -4.04 a0 6.49 8.73 aa0 4.88 6.50 0 yay -2. -3.51 a0 4.71 6.70 0 yy -1.95 -2.60
Dickey-Fuller检验的例子
Nelson和Plosser(1982)认为宏观经济变量是差分平稳不是趋势平稳。下面给出正式检验,估计回归方程
t01t1t13012t0t1t01tt1tiyti1t yta0a1tyt1i2p传统的经济周期观点认为GNP和产出
水平是趋势平稳而不是差分平稳。这里也就
是说不为零。给定Nelson的样本,在0.05的水平上,对零假设=0的t-统计量的临界值是-3.45。所以,如果的估计值大于3.个标准差,则可以拒绝零假设=0。从表4.3中可以看到:对于实际GNP、名义GNP、工业产值的的估计值都不是显著异于零的。只有失业率的的估计显著异于零(在0.05水平上)。
表4.3 Nelson和Plosser的单位根检验
aa p 实际2 0.819 0.006 -0.175 GNP (3.03) (3.03) (-2.99) 名义2 1.06 0.006 -0.101 GNP (2.37) (2.34) (-2.32) 工业产6 0.103 0.007 -0.165 值 (4.32) (2.44) (-2.53) 失业率 4 0.513 -0.000 0.294 01(2.81) (-0.23) (-3.55) 注:1, p是选取的滞后长度。括号中的值是系数除以标准差,所以括号中的值代表了系数为零的零假设的t-检验。在非平稳的零假设下,必须使用Dickey-Fuller临界值。在0.05显著水平上,t-统计量的临界值是-3.45。 2,“”表示在0.05显著水平上显著。所以失业率似乎是平稳的。
5 Dickey-Fuller检验的扩展 对一个p阶自回归过程
yta0aiytiti1p
通过增加某项,减去某项,可得类似(4.4.5)的方程如下: (4.4.7)
ai),这里(1i1pyta0yt1iyti1ti2p
iaj
jip如果0,则方程含有一个单位根,我们
可使用同样Dickey-Fuller统计量来检验单位根的存在。统计量也依赖于包含在方程中确
定性成分。如果没有截距和趋势项,使用统计量。只有截距项,使用统计量。有截距和趋势,使用统计量。如果差分方程系数和为1,至少有一个特征根为1。所以,如果a1,则0,系统有一个单位根。
注意,Dickey-Fuller检验假设误差是的且有常量方差。由于我们不知道真实的数据生成过程,所以,存在下面六个相关的问题需要做进一步分析: (1) 数据生成过程可能包含自回归和运动平均部分。如果运动平均项的阶数未知,应怎样执行检验。
(2) 除非所有自回归项都包含在估计的方程中,否则将不能准确的估计和它的标准差。如果(4.4.7)是真正数据生成过程,那么简单的回归yta0yt1t是不充分的。由于自回归的真正阶未知,问题是如何选取适当的滞后长度。 (3)Dckey-Fuller检验只考虑了一个单位根的情况。但是一个p阶自回归有p个特征根。如果有mp个单位根,序列需要差分m次达到平稳。
i(4)也许有一些根需要一阶差分,另一些根需要季节差分。我们需要给出一种方法来区分这两种类型的单位根。
(5)在数据中也许有结构性间断。这种间断可使数据带有明显的趋势。
(6)在(4.4.7)中是否存在截距项或时间趋势项。
由于一个可逆的MA模型可变成一个自回归模型。这个方法可被一般化,令y序列由自回归运动平均过程生成:
t A(L)ytC(L)t 如果C(L)的根在单位圆外,则有 A(L)yt/C(L)t
或令D(L)=A(L)/C(L),则可写成 D(L)ytt
即使D(L)是无穷阶多项式,我们也可以用同样方法对(4.4.7)得到无穷阶自回归模型
ytyt1iyti1t
i2
(4.4.8)
(4.4.8)是无穷阶自回归,不能用有限
的数据来估计。但,Said和Dicky(1984)证明了:一个未知的ARIMA(p,1,q)过程可由n阶自回归ARIMA(n,1,0)来逼近(这里nT)。所以我们可以利用有限阶自回归来逼近(4.4.8),从而解决第1个问题。对0检验可通过使用Dickey-Fuller统计量,,来检验。
滞后长度的选择
现在解决第2个问题。 如果滞后阶数太少,可能使回归残差不能近似为白噪声。这个模型不能准确描述误差过程,因而不能准确地估计和它的标准差。如果包括太多的滞后项,能降低拒绝一个单位根的零假设的检验功效,因为增加滞后阶数必须估计额外的参数且损失自由度。由于要估计的参数的增加,使自由度减少,可利用的观测值也减少(在自回归中每增加一阶滞后,就损失一个观测值)。所以,过多的滞后项将减少Dickey-Fuller检验单位根的功效。 在这种情况下,应怎样选取滞后长度?一种方法就是从相对较长的滞后长度开始,然后再使用t-检验或F-检验来逐个删减滞后
1/3项。如果使用季度数据,可用滞后3年的数据(p=12)。若滞后12阶的t-统计量在某临界值处不显著,且F-统计量说明了9-12阶滞后也是不显著的,则保留滞后阶数1-8阶。然后对滞后8阶和5-8阶重复上述过程,直到确定合理的滞后阶数。
一旦确定了暂时的滞后长度,就可进行诊断检验。残差图是最重要的诊断工具。不应该有结构性变化和序列相关的显著证据。残差的相关图应该显示出白噪声特征。Ljung-Box的Q统计量不应显示残差中有自相关的显著性。
2 具有结构性变化的单位根检验
在进行单位根检验时,如果怀疑有结构性变化时,则检验需要特别小心。因为当有结构性变化时,各种Dickey-Fuller检验统计量倾向于接受有一个单位根假设。
为了说明这些,考虑一个时间序列,在均值处有一次变化,其它地方是平稳的。
yt0.5yt1tDL (4.6.1)
这里
DL是虚拟变量,对t1,,50,DL0,对
t51,,DL10。0
在实际中,结构性变化往往不是这样明显,图4.6.1中的直线似乎说明序列有确定性趋势。直接拟合方程为
yta0a2tet。
图4.6.1 两个结构性变化模型
估计(4.6.1)的适当方法是拟合简单的AR(1)模型且截
yt0.5yt1tDL ytyt1tDP
距项是变化的(通过加入虚拟变量DL使截距项发生变化)。但是,如果我们拟合回归方程
yta0a1yt1et (4.6.2)
则a1的值一定靠近1。造成这个偏差(向上偏移)的原因是:估计值a1在一定程度上反映了“yt的较低的值跟随着其它低值(零附近),较高的值跟随着其它较高的值(均值6附近)”。
a1的这种偏差意味着,虽然这个序列是平稳的,Dickey-Fuller
检验倾向于接受有一个单位根的零假设。
当然单位根过程也能显示一个结构性间断。图4.6.1中
第二个图给出了
ytyt1tDP 这里DP(51)4,所有其它值DP0。
结构性变化的检验
在存在结构性间断时,检验单位根的一个直观想法是:将样本分成两部分,在每部分上使用Dickey-Fuller检验。这种方法的问题是:每个回归结果的自由度减少,而且,也许还不知道间断点在什么地方出现。所以,还是应该对全样本进行检验。
Perron(19)给出了在t1处存在结构性变化时的单位根检验的程序。考虑零假设H1:一个单位根过程在水平处有一次跳跃,备择假设A1:一个趋势平稳过程在截距处有一次永久跳跃。正式地,零假设和备择假设是
H1:yta0yt11DPt (4.6.3) A1:yta0a2t2DLt (4.6.4) 这里DP代表脉冲虚拟变量
1,t1 DP0,否则DL代表水平虚拟变量
1,t DL0,否则 图4.6.2 结构性变化
图4.6.2 中的曲线显示了零假设下的时间路径。过程在t处,水平方向上发生了一次跳跃。之后,过程仍继续是先前的带漂移的随机游动过程。备择假设认定序列围绕趋势线是趋势平稳的,即在t之前,围绕趋势线a0a2t平稳,从1开始,序列围绕趋势线a0a2t2平稳。
需要计量检验的问题是确定观测到的序列是由(4.6.3)模拟还是由(4.6.4)模拟。Perron(19)的方法如下:
ˆt。 1步:在备择假设下估计模型,去掉趋势得到残差yˆt2 步:估计回归yˆt1+t a1y在一个单位根的零假设下,a1的理论值是1。Perron(19)证明:当残差是同分布时,a1的分布依赖于/T, T是样本观测个数。
3步:进行诊断检验来确定2步中的残差是否为序列无关。如果序列相关,利用回归的扩展形式
ˆta1yˆt1iyˆtit yi1k 4步:对零假设a11计算t-统计量值,并与Perron给出的临界值相比较。当0,1时,临界值与Dickey-Fuller统计量的临界值相同。当01时有结构性间断。当0.5时,两个统计量的值的差最大。对0.5,t-统计量临界值在5%的显著水平上是-3.76(按绝对值大于Dickey-Fuller的对应的临界值-3.41)。如果t-统计量大于Perron给出的临界值,则拒绝有一个单位根的零假设。
当然,可以把1步,2步,3步结合起来,简单地估计方程
yta0a1yt1a2t2DLyii1ktit
对零假设a11的t-统计量与Perron给出的临界值相比较。这个方法是通用的,也允许在漂移处有一次变化或在均值和漂移处有一次变化。
例如,可以检验在漂移项处有一个持久变化的零假设,备择假设是:在趋势的斜率处有一个变化。这时零假设是:
H2:yta0yt12DLt
这里,如果t,DL1,否则,DL0。 备择假设是:
A2:yta0a2t3DTt
这里对t,DTt,否则,DT0
更一般的,可以结合这两个零假设H1和H2: H3:yta0yt11DP2DLt 这时的备择假设是
A3:yta0a2t2DL3DTt
ˆt估当然,这种方法需要估计回归A2或A3。然后,使用残差y计回归
ˆta1yˆt1+t y如果由这回归方程中得到的残差不是白噪声,以扩展的检验的形式估计这个方程。对于零假设a11的t-统计量值可与Perron(19)给出的临界值相比较。对0.5,Perron在5%的显著水平上给出了H2的t-统计量的临界值是-3.96,H3的t-统计量的临界值是-4.24。 结构性变化的Perron检验
Perron(19)的关于结构性变化的分析说明:大多数宏观经济变量并不是单位根过程,相反,这些变量似乎是具有结构性间断的趋势平稳过程。按照Perron(19),1929年的股票市场崩溃和1973年的油价的猛涨是外生冲击,并对大多数宏观经济变量的均值有持久效应。这种崩溃引起了均值上的一次下降,在其它处,宏观经济变量似乎是趋势平稳。
Perron研究的所有变量(除实际工资,股票价格和平稳的失业率外)似乎都有一个常数斜率的趋势并在1929年左右有一个主要变化。为了考虑关于股票市场崩溃效应的各种假
设,考虑回归方程
yta01DL2DPa2ta1yt1iytit
i1k这里:DP(1930)1,在其它处为零。 对1930年后DL1,其它时间DL0。
在“单位根过程的水平有一次变化的”假设下,a11,a20,20。在“趋势平稳模型中有一次永久的间断”
的假设下,a11,10。Perron(19)给出了实际GNP,名义GNP,工业产值的检验结果。
表4.6对Nelson和Plosser数据的结构性变化的再检验 T K a0 1 2 a2 a1 实际62 0.33 8 3.44 GNP -0.1 -0.018 0.027 0.282 (5.07) (-4.28) (-0.30) (5.05) (-5.03) -3.60 0.100 0.036 0.471 (5.44) (-5.42) 0.032 0.322 名义62 0.33 8 5.69 GNP (5.44) (-4.77) (1.09) 工业111 0.66 8 0.120 -0.298 -0.095 产值
(4.37) (-4.56) (-0.095) (5.42) (-5.47) 给定每个序列的长度,1929年的崩溃对实际和名义GNP意味着1/3,对工业产值意味着2/3。滞后长度可根据系数
i的
t-检验来确定。如果k的t-统计量的绝对值大于1.60,
i(ik)的
t-统计量的绝对值小于1.60,则应该选择该k值。
首先看实际GNP的结果,看表的最后一列,支持单位根假设的证据很少。a1的估计值0.282是在1%水平上显著异于1。而实际GNP似乎有确定性趋势(a2的估计超过5个标准差异于零)。点估计10.1是显著异于零(在通常水平上)。因此,股票市场的崩溃导致了实际GNP的截距的一次永久减少。
所有a1的值大约是5倍的标准差异于1,确定性趋势的系数a2的值大约是5倍的标准差异于0,所有1的值在1%的显著水平上显著为负,这些数据说明:除了由于股票市场的崩溃而导致的结构性间断以外,实际宏观经济变量是趋势平稳的(TS)。
3 功效与确定性解释变量
单位根检验并不能很好地区分:时间序列的特征根接近于1和特征根为1的情况。这涉及到检验的功效和回归方程中是否存在确定性回归变量。 功效(Power)
一个检验的功效是:拒绝一个错误零假设的概率(即,1-P(第二类错误))。Monte Carlo 模拟说明:各种Dickey-Fuller
检验的功效是非常低的。这些检验也经常认为一个序列含有单位根,且区分趋势平稳和随机游动过程时也有很低的功效。在有限样本中,趋势平稳过程都可用一个单位根过程来近似,一个单位根过程也能由一个趋势平稳过程来近似。
在一个随机游动加噪声的模型中,加入一个截距项,
yta0tt
(4.6.5)
如果Var(t)0,yt显然是一个单位根过程。如果Var(t)0,则yt是趋势平稳过程
yty0a0tt
(4.6.6)
这里y0是yt的初始值。
因此,差分平稳过程(4.6.5)和趋势平稳过程的差别主要在于t的方差。由于有两个冲击成分t和t,没有简单办法来确定Var(t)2是否为零。当2较大时,将很难区分TS和DS序列。如果趋势平稳过程的随机部分的方差较大,则很难区分单位根和趋势平稳。
确定性回归变量的确定
在单位根检验中,估计下面一般方程来检验p0:
yta0yt1a1tiyti1t (4.6.7)
i2如果真实过程是随机游动,这个回归应有a0a10。估计更多的参数,将会降低自由度和检验功效。降低功效意味着:没有单位根存在时,检验将接受有一个单位根的零假设。
另外的问题是检验0的统计量(,,)依赖于模型中包
含哪些回归变量。考察三个Dickey-Fuller表,对一个给定的显著水平,如果模型中包括截距项和时间趋势项,=0的置信区间就会明显扩大。但当yt是平稳时,t-统计量的分布并不依赖于其它回归变量的存在。不正确地忽略掉截距或时间趋势项会使检验功效降为零。例如,如果(4.6.7)中数据生成过程包括一个趋势,忽略了a2t项会使的估计值有向上偏差。另一方面,增加额外的回归变量会增大临界值的绝对值,导致不能拒绝一个单位根的零假设。
如何能确定是否包括截距或时间趋势项?关键问题在于:单位根的检验是依赖于确定性回归变量的存在,确定性回归变量存在的检验依赖于单位根的存在。
Campbell和Perron(1991)给出了下面单位根检验方法: (1) 估计的回归方程中包含了真正数据生成过程的所有确定性成分,在有一个单位根的零假设下,的分布是非正态的。这个分布随着方程中包含的参数而变化。
(2) 如果估计的回归方程中包含确定性回归变量(而实际数据生成过程不含确定性回归变量),单位根检验(备择假设是平稳序列)的功效随着确定性回归变量的增加而减少。
(3)如果估计的回归方程中忽略了重要的确定性趋势变量(实际数据生成过程含有确定性趋势变量),当样本增加时,t-统计量的检验功效趋于零。如果回归中忽略了非趋势
变量(如截距项),t-统计量是一致的,但当被忽略的变量的系数越大,有限样本功效就会越小。这些结果说明:由于回归方程中确定性变量的设定不当,会导致不能拒绝一个单位根的零假设。太多或太少的回归变量都能导致接受一个单位根的零假设。虽然有时不能确定在模型中是否应包含合适的确定性回归变量,一般来说,下面的方法准则是有用的。
1)描绘散点图:可用来帮助确定数据中是否明显的趋势。 2)清楚零假设和备择假设:当使用Dickey-Fuller检验时,总要在备择假设下估计模型,按零假设来加入。由于零假设是:序列有一个单位根,所以总是按照平稳或趋势平稳来估计这个序列。例如,实际GDP序列随时间而向上倾斜,要分析的问题是这序列是趋势平稳的还是含有单位根加漂移项。合适的估计模型有形式
yta0yt1a1tiytit。然后可以检验
0或a10。
3)由于在单位根检验中,不希望因为包括确定性回归变量而损失功效。但忽略回归变量又能导致错误设定误差。Sims,Stock和Watson(1990)给出了一个第二法则来选择适当的回归变量:
如果数据生成过程包含确定性回归变量(截距或时间趋势)且估计一个包含这些确定性回归变量的方程时,可通过t-检验或F-检验来对所有系数进行统计推断。这是因为,对
具有不同收敛速度的参数之间的单一的检验渐近地被具有最慢收敛速度的参数所控制。
如果估计方程时,包含确定性回归变量,而实际数据生成过程不包含确定性回归变量时,Dickey-Fuller分布是非标准的。
如果估计的模型是形如
a yta01tty1i2piti1y,而实际数据生成过t程包含一个趋势,检验=0的零假设可使用标准正态分布。
当数据生成过程是完全未知的时候,Dolado Jenkinson和Sosvilla-Rivero(1990)给出了具有一个单位根的程序:
第1步:估计最少可能的模型(一般包含趋势和漂移项),使用统计量来检验零假设=0,拒绝这个零假设的单位根检验的功效较低。如果这个零假设被拒绝,不需要再继续检验,yt不含单位根。
第2步:如果零假设没被拒绝,需要确定在模型中是否包含了确定性回归变量,这些回归变量的存在会降低检验功效。可利用3统计量检验假设a10,如果趋势项不显著,进行第3步。如果趋势项显著,使用标准正态分布再检验单位根的存在。总之,如果数据生成过程含有趋势项,的极限分布是标准正态分布。如果一个单位根的零假设被拒绝,检验不再进行。序列不含单位根。
第3步:估计没有趋势的模型(形如(4.4.5)),使用统计量检验单位根的存在。如果零假设被拒绝,那么模型不包含单位根。如果零假设没被拒绝,使用1统计量来检验
a00,如果常数项不显著,估计(4.4.5)形式的方程,并进
行第4步。如果常数项显著,使用标准正态分布检验单位根的存在。如果一个单位根的零假设被拒绝,序列不含单位根。
第4步:估计(4.4.4),使用统计量检验单位根的存在,如果零假设被拒绝,序列不含单位根,否则含有一个单位根。
通过描绘数据的散点图可以判断数据生成过程是否存在确定性回归变量。利用一些适当的理论,也可以确定适当的回归变量。市场有效假说理论认为,资产收益中不应存在确定性趋势。同样,在检验PPP假设中,也不应使用确定性时间趋势。但当数据生成过程是完全未知时,这个程序是明智的。
估计 yta0a1tyt1iyt1t否 得出结论:不存在单位根 0否 是:检验趋势是否存否 a0 当0 时,是否1是 估计 利用正态分布 检验是否0 yt有单位根 否 yta0yt1iyt1t0是:检验漂移项是否存在 得出结论:不存在单位根 否 否 利用正态分布 检验是否0 否 是 a0 当0 时,是否0是 估计 ytyt1iyt1tyt有单位根 yt没有单位根 是 0yt有单位根
GDP和单位根 下面单位根检验
ADF 检验,对美国实际GDP对数{yt}的
yt0.06350.00048t0.0629yt10.256yt10.1486yt2 (3.72) (3.27) (-3.37) (3.39) (2.45)
这个检验似乎说明{yt}是趋势平稳的。零假设0的t-统计
量值是-3.37。在10%和5%显著水平上,的临界值分别为-3.15和-3.45。如果使用10%的显著水平,则不需要继续检验了,可以认为没有单位根。但在5%的显著水平上,不能拒绝单位根的零假设。因此,由于不必要的时间趋势或漂移项的存在,检验的功效降低。零假设a10的t-统计量为3.27,但不要因此就认为a1显著不为零。如果使用3统计量联合检验假设a10。对模型的F统计量值为6.14。在5%的显著水平上,3的临界值为6.49,所以,接受假设零假设
a10。下面估计无趋势模型
yt0.00840.0021yt10.248yt10.145yt2
(2.80) (-1.22) (3.20) (1.88) 零假设0的t-统计量值是-1.22,因为统计量在
5%的
显著水平上,临界值为-2.,不能拒绝单位根的零假设。如果截距项不显著,此检验的功效是很低的。为了检验截距项
的显著性,使用1统计量。对模型的F统计量值为13.43,临界值为4.71,可以拒绝零假设。由于拒绝a00,可以使用标准正态分布检验根和漂移项。
4 趋势和单变量分解
Neleon 和Plosser (1982) 认为:许多经济时间序列都有一个随机趋势和一个平稳成分。许多经济理论都说明在一个序列中区分暂时成分和持久成分是非常重要的。如,消费函数理论把个人收入分解为暂时和永久成分。
如果序列{yt}的趋势是确定性的,那么这种分解是容易的。如果趋势是随机的,那么这种分解就困难了。Beveridge 和Nelson (1981)给出了怎样将任意一个ARIMA(p,1,q)模型分解为一个带漂移的随机游动成分和平稳成分,即趋势加不规则模型的方法。
任何ARIMA(p,1,q)序列的1阶差分都可写为平稳的无穷阶移动平均表达式
ytyt1a0t1t12t2 定义 ett1t12t23t3 所以,
0,因而,显著为零,认为序列有单位
ytsyta0setii1s
又由于
ei1stiti1t1i2t2i3t3i
i1i1i1i1ssss因为Etti0,于是,预测函数可写为
Etytsa0syt(i)t(i)t1(i)t2
i1i2i3ss1s2当s1时,上方等式右端是yts的预测值。预测水平是s的线性函数,斜率为a0,水平为
yt(i)t(i)t1(i)t2。
i1i2i3ss1s2在t期,这一随机水平称为t期的随机趋势值,用t来表示,这一趋势加上确定性值a0s构成了预测值Etyts。
趋势被定义为预测函数的极限值的条件期望,换句话说,趋势是指“长期”预测。为了求出随机趋势,令s,求Et(ytsa0s)的极限。所以,随机趋势为
yt(i)t(i)t1(i)t2
i1i2i3y1ts注意等式 ytsyts 所以,趋势的随机部分
y2ty1t yttlimEtytsa0slimEt(ytsyts1yt2yt1)yta0s
ssyt减去确定性趋势和随机趋势的和是平稳成分(不规则
成分),所以平稳成分为
ytlimEtytslimEt(ytsyts1yt2yt1)
ss因此,Beveridge和Nelson(1981)的方法如下:
第1步:使用Box-Jenkins的方法估计yt的ARMA(p,q)。 第2步:对每个t和s值求出Etyts。对每个t值求和
Et(ytsyts1yt2yt1)yt。
在Beveridge和Nelson的研究中,令s=100。对于第1个可使用的观测值(t=1)求和
1E1(y101y100y2)y1
第1期趋势中的随机成分为E1y101a0s,确定性成分为
a0s。对于第t=2期
2E2(y102y101y3)y2
对于第t=T期,
TET(yT100yT99yT1)yT
从而得到序列t。
第3步:从yt中减去t期趋势的随机成分,从而得到t期的平稳部分(不规则成分)。所以,平稳成分(不规则成分)为
Et(yt100yt99yt1)。
Hodrick-Prescott 分解
Hodrick-Prescott(1997)给出了另一种将一个序列分解为一个趋势和一个平稳成分的方法。假设观测到y1至yT的值,将这个序列分解为一个趋势t和平稳成分ytt,考察其平方
和
1TT122(y)[()()] ttt1ttt1Tt1Tt2其中,是常量,T为观测到的样本数。
通过选择t序列,使得上方的平方和达到最小。在许多应用中,取为1600。增加值,起到平滑趋势的作用。如果取为0,则当ytt时,平方和达到最小,趋势即为yt本身。如果时,则趋势的变化为常量,所以,有线性时间趋势。
Hodrick-Prescott分解的优点在于它使用同样的方法将趋势从一系列变量中区分出来。如许多实际经济周期模型说明:所有变量有相同的随机趋势。Beveridge和Nelson的分解方法应用到每个变量中,将不会是各个变量得到相同的趋势。
9.Panel 单位根检验
通常的单位根检验显示经济时间序列具有单位根。当然,序列很可能是均值回复的。但,Dickey-Fuller 检验有很低的功效来显示序列的平稳性。要想获得更强的功效,一种办法是在获取大量的序列的估计值后,在检验这些集中起来的值,这样可以得到更有效的检验方法。理论依据中心极限定理。
Im,Pesaran 和Shin (2002)提出:对许多相似的时间序列(面板数据),如何构造单位根检验。假设有n个序列,
每个序列都包含T 个观测样本对每个序列构建一个ADF检验
yitai0ai1tiyit1ijyitjit,i1,,n
j1pi由于每个方程的滞后长度可以不同,所以要对每个方程分别进行滞后长度检验。而且也可以去掉时间趋势。如果一个方程中包含了趋势,那么所有的方程都应包含趋势。一旦估计了每个i,就可获得零假设i0的t-统计量。在传统的Dickey-Fuller检验中,对每个t-统计量(用ti表示),与Dickey-Fuller检验临界值相比较。在Panel单位根检验中,构造t-统计量的样本均值为
1ntti ni1构造统计量
Ztn(tE(t))
Var(t)这里E(t)和Var(t)表示t的理论均值和方差。如果每个ti的最小二乘估计是无偏的,E(t)得值为零。为了修正事实上的偏差,
E(t)和Var(t)值可有
Monte Carlo 模拟得到。Im,Pesaran 和
Shin(IPS)给出了这些值: T
6
8
10
15
20
50
100 500
E(t)
-1.5-1.5-1.5-1.5-1.5-1.5-1.5-1.52
0
0
1
2
3
3
3
Var(t)1.75 1.23 1.07 0.92 0.85 0.76 0.74 0.72
IPS证明了:Zt有渐近标准正态分布。由于每个ti得估计值是的,根据中心极限定理,样本均值偏离真实均值的偏差服从正态分布。拒绝零假设Zt0,等价于接受备择假设:“至少有一个i异于零”。这说明在大样本的情况下,Zt有渐近标准正态分布。在一般情况下,使用下表中的临界值。这些临界值依赖于n,T及是否有时间趋势。
IPS Panel单位根检验的临界值 n/T
25
10% 5%
1%
50
10% 5%
1%
70
10% 5%
1%
没有时间趋势
5 -2.0-2.1-2.4-2.2-2.1-2.4-2.0-2.1-2.4
4
8
6
0
5
2
2
5
0
7 -1.9-2.0-2.3-1.9-2.0-2.2-1.9-2.0-2.2
5 1
8
2
5
6
8
5
6
8
-1.8-1.9-2.1-1.8-1.9-2.1-1.8-1.9-2.1
9
9
8
8
6
8
8
6
0 8 2
-1.7-1.8-1.9-1.7-1.8-1.9-1.7-1.8-1.9
2
4
5
1
3
5
1
3
5 5
5-1.6-1.7-1.8-1.6-1.7-1.8-1.6-1.7-1.7
3
2
8
3
1
8
3
3
0 9
有时间趋势
5 -2.6-2.8-3.0-2.6-2.7-3.0-2.6-2.7-3.0
5
0
9
2
6
2
2
5
0
7 -2.5-2.7-2.9-2.5-2.6-2.8-2.5-2.6-2.6
8 1
0
4
6
7
8
5
6
7
-2.5-2.6-2.8-2.5-2.5-2.7-2.4-2.5-2.7
2
2
0
9
7
9
8
5
0 1 2
-2.3-2.4-2.5-2.3-2.4-2.5-2.3-2.4-2.5
5
8
8
4
5
8
4
4
5 9 5
-2.3-2.3-2.4-2.3-2.3-2.4-2.3-2.3-2.4
7
5
2
6
4
2
6
4
0 3
10.总结
随机序列中的趋势包括确定性部分和随机部分。差分可以消除随机趋势,去趋势可以消除确定性趋势,差分趋势平稳序列和对含有随机趋势的序列去趋势都是不恰当的。
与传统理论相反,大多数宏观经济数据都含有一个随机趋势。在有限样本中,一个单位根过程的自相关图将缓变趋于0。所以,缓变递减趋于0的ACF预示着一个单位根过程
或拟单位根过程。由于许多经济时间序列似乎有非平稳部分,所以,当我们处理这样一个时间序列时,需要详细考虑是去趋势还是一阶差分,还是由于这序列也许是平稳的而不要做任何变换。
对于短期预报来说,趋势的形式并不重要。但随着预测水平的扩展,趋势的精确形式就显得更重要了。平稳性意味着没有趋势,且长期均值回返。一个确定性意味着对无穷的将来稳定增加(或减少)。对一个具有随机趋势的序列的预测收敛到一个稳定水平。
通常的t-统计量和F-统计量不能用来确定一个序列是否有一个单位根。Dickey-Fuller(1979,1981)提供了合适的统计量来确定一个序列是否有一个单位根,一个单位根加漂移或一个单位根加漂移加时间趋势。也可通过考虑季节单位根来修正检验。结构性间断也偏离Dickey-Fuller检验(倾向于接受单位根),Perron(19)说明了:在单位根检验中可以考虑具有结构性变化的情况。但也需慎重,因为通常会难以确定时间序列中是否具有结构性变化。Perron和Vogelsang(1992),Vogelsang和Perron(1998)给出了当结构性间断的时间未知时,检验单位根的方法。如果一个单位根过程的残差是相关的或弱相关,可利用Phillips-Perron(1988)的检验方法。
所有的检验在区分单位根和拟单位根时功效都很低。一
个趋势过程可由一个单位根过程来近似,一个单位根过程也可以由一个趋势平稳过程来近似。而且在存在确定性回归变量(截距和确定性趋势)时,可利用Campbell和Perron(1991)给出的单位根检验方法。模型中包含过多或过少的回归变量都能降低检验的功效。Panel单位根检验可以用来增加单位根检验的功效。
附录一:Monte Carlo 试验
Dickey和Fuller(1979,1981)所使用的获取临界值的检验方法是现代时间序列分析中常用方法。对非平稳变量的系数的假设检验,不能采用传统的t-检验和F-检验。检验统计量的分布是非标准的。使用Monte Carlo模拟能很容易模拟出非标准分布。
Monte Carlo模拟是用计算机复制一个数据的真实生成过程(DGP),生成样本容量为T的随机样本,并能估计出重要的参数和样本统计量的值。这一过程可以重复N次,使得参数的分布和样本统计量的值可被制成表格,得出经验分布。这些经验分布可作为实际分布的估计值来使用。
大多数统计软件包都可以生成随机数。Monte Carlo试验的一般步骤是:
第1步:根据给定的分布(正态分布、t-分布等),用计算机模拟出一系列随机数。通常情况是假设这些随机数来自
于正态分布,并且序列不相关。用这些随机数代替扰动序列
{t}。
第2步:指定参数和序列{yt}的初始条件。利用这些参数、初始条件和随机数可以构造序列{yt}。
第3步:估计重要参数。
第4步:大量重复第1步和第3步,目的在于使生成的序列{yt}的统计特征与其真实分布相一致。
构造DF分布
为了得到Dickey和Fuller(1979)的分布可遵循如下步骤: 第1步:生成一个随机数集来代表序列{t}。在通常的假设下,可以从一个标准正态分布(也可以利用其它分布)中得到100个随机数。
第2步:构造序列ytyt1t。这时需要初始化y0。为了使模拟结果不过分依赖初始值的选取。一种方法是可以将y0的初始值设定为序列{yt}的无条件均值,另一种方法是可以选取一个y0,然后生成T+50个{yt},放弃前50个值使用后面T个{yt}。这样做的目的是初值选取的效应将在50期后消失。 第3步:在备择假设下估计方程。估计方程yta0yt1t,然后得到零假设0的
t-统计量。这里注意,数据是在单位
根的零假设下生成的,方程是在备择假设下估计的。 第4步:重复第1步到第3步10000次,或者更多。如果使
用T=100的样本容量,可得到类似于下图所示的Dickey-Fuller的分布。由于使用的是不同的随机数集,所以不可能得到与下图完全相同的分布。
-2 -1 0 1
图- DF分布
上图中DF分布是进行了10000次模拟。增加模拟次数会使分布更平滑。分布的均值小于零。T-统计量的均值为-1.53, 零假设0的
t-分布与Dickey和Fuller所得到的值仅
仅有微小的差异,大约95%小于-2.,99%小于-3.51。因此,如果估计模型yta0yt1t,并发现零假设0的
t-统计量
为-3.00,则可以在5%的显著水平上拒绝单位根的零假设,但在1%的显著水平上不能拒绝单位根的零假设。
Monte Carlo试验的一个局限性是其在生成模拟数据时使用的假设具有特殊性。要使得Monte Carlo分析更完善,需要知道模拟结果是否对生成数据时所使用的假设非常敏感。显然,样本容量对模拟结果有影响。但是,对于DF检验来说,截距项a0的大小对于斜率系数的估计没有影响。类似地,
{t}不服从正态分布时,对估计的结果有影响。
自助(Bootstrap) 法
Bootstrap法类似于一个Monte Carlo试验,但存在一个本质的差异。在Monte Carlo试验中,对给定的分布如正态分布来构造随机变量,在Bootstrap法中,随机变量是根据对它们观测得到的分布获得的。事实上,随机变量的观测分布是实际分布的最优估计。
Efron(1979)提出了Bootstrap的思想。观测到的数据序列是根据生成数据时的实际可能分布中获取的随机样本。在某种意义上,数据的经验分布是数据的实际分布的最优估计,这样,经验分布函数被定义为每个观测值出现的可能性为1/T离散分布。经验分布函数—并不是某个预先指定的分布诸如正态分布—被用于生成随机变量。Bootstrap样本是样本容量为T的随机样本,其从每个观测值出现的可能性概率为1/T的观测数据中获得。
Bootstrap回归系数
假设有一个观测样本数为T的数据序列,并且想估计变量x对变量y的影响。为此目的,可能估计线性回归方程
yta0a1xtt
虽然这里的估计值的性质是已知的,但如果回归残差不
是近似于正态分布,那么,没有足够的理由使用标准的t检
ˆ0和aˆ1统计特征的Monte Carlo试验。我们应该构建一个涉及a验。但是,并不是从一个正态分布中选择t的各个值,可以使用实际的回归残差,这一方法被称为Bootstrap的残差方法。为使用其方法,构建如下的步骤
第1步:估计模型并计算其残差值
ˆ0aˆ1xt etyta第2步:构建误差项的一个自助样本,其元素为
e1,e2,,eT。使用Bootstrap样本计算Bootstrap的y序列(称
为y)。对于t从1到T的每个值,计算
yt
ˆ0aˆ1xtet yta注意系数的估计值被当做固定值对待。而且,xt的值被当做固定值对待,以便于它们与Bootstrap样本中的值保持相同。
第3步:用Bootstrap样本估计a0和a1的新值,结果记为
a0和a1。
第4步:重复第2步和第3步多次,并计算a0和a1的样
ˆ0和aˆ1有相同的分布。例如,我们可以本统计值。这些应与aˆ1找到95%的置信区间,a1为a的值的最低2.5%和最高97.5%
之间的区间。
对于一个包含滞后变量的时间序列模型,需要修正第2
{y步。这样,Bootstrap序列t}构造的方式有所不同。考虑简
单的AR(2)模型
yta0a1yt1a2yt2t
正如在第2步中所看到的,我们可以构造一个误差项的
,e2,,eTBootstrap样本,包含元素e1。现在,使用这些误差
项样本构造自回归序列{yt}。特别地,给定a0,a1和a2的估计
值和两个初始条件y1和y2。序列{yt}的其它值的构造如下:
垐 yaayaye t01t12t2t
对于一个AR(p)模型,初始条件y1至yp是从实际的序列{yt}中获取的残差中选取的。为了避免涉及初始值的选择问题,通常的做法是抛弃前面50个样本,从第T+50个样本开始构造Bootstrap样本。
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- haog.cn 版权所有 赣ICP备2024042798号-2
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务