预 测
FORECASTING
2007年第4期
基于ARIMA(p,1,q)过程的MMSE预测可靠性研究
华中生, 查迎春, 张斌
(中国科学技术大学管理学院,安徽合肥230026)
摘 要:现实中的决策大多建立在对数据的预测之上,但研究者通常很少涉及预测的不可靠性问题,而暗含假定预测是可靠的。基于目前预测残差为正态白噪声的预设,提出了预测可靠性的概念,以及预测可靠性的度量方法,同时以需求预测中常见的ARIMA(p,1,q)过程MMSE(最小均方差)预测为背景,分析了可靠性与预测精度的关系,以及模型参数对可靠性的影响,初步讨论了可靠性在预测期决策方面的作用。关键词:预测;预测可靠性;ARIMA;预测期
中图分类号:F224 文献标识码:A 文章编号:1003-5192(2007)04-0059-05
ReliabilityofMMSEForecastBasedonARIMA(p,1,q)
HUAZhong-sheng,ZHAYing-chun,ZHANGBin
(SchoolofManagement,UniversityScienceofTechnologyofChina,Hefei230026,China)
Abstract:Manyrealdecision-makingproblemsaremodeledandsolvedonforecastingdata.Despitethefactthatalmostallforecastsareunreliable,researchersrarelyaddressit.Thispaperproposestheconceptofforecastreliability,andnewmeasurementforforecastreliability.BasedonAutoregressiveIntegratedMovingAverage(ARIMA)processanditsMin-mumMeanSquareError(MMSE)forecasti,thepapercomparesforecastaccuracywithforecastreliability,andanalyzestherelationshipbetweenspecificprocessparametersandreliability,anddiscussestheinfluenceofreliabilityondecision-makingonforecasthorizon.
Keywords:demandforecast;forecastreliability;ARIMA;forecasthorizon
1 引言
现实中的决策通常建立在对数据的预测之上,很少有研究涉及预测的不可靠性问题,而暗含假定预测是可靠的。在供应链管理的文献中,经常预先假定终端需求遵从某一个特定的过程或者分布,如AR(1)应
[1,4]
[1,2]
态分布。对于预测的评价,目前的研究大多基于残差本身建立精度指标。这种事后的检验方法只能评价过去,而不能对未来的预测是否可信提供保证。因此有必要从过程本身出发,研究他们用于预测时的一些基本特性。目前从特定的过程及其参数与牛鞭效应之间的关系已开始有研究
[5]
。本文
,ARIMA(0,1,1)
[3]
,以此来描述需求的
从预测残差的分布出发,研究其与事先假定的干扰之间的关系,从过程本身分析预测的可靠程度。
首先基于干扰与残差的分布,提出预测可靠性的概念、定义,以及预测可靠性的度量方法,以需求预测中常见的ARIMA(p,1,q)过程MMSE预测为背景,分析了可靠性与预测精度的关系,以及过程参数对可靠性的影响,初步讨论了可靠性在预测期决策方面的作用。
2 预测的不可靠/可靠性定义
很多学科给出过可靠性的定义。文献[6]定
不确定性或者研究供应链中的一些问题,如牛鞭效
。现实中的决策者在分析销售数据基础上确定能最优描述其需求特性的过程或者分布,然后使用预测方法(如指数平滑,MMSE等)做出预测。因此在真实需求与预测值之间存在偏差(残差),拟合过程中要检查残差的特性,如正态性、齐次性等。
目前绝大多数文献研究中无论是假定的还是由数据拟合的需求过程,都存在两个基本的假定:一是残差是由外界的干扰造成的;二是残差基于正
收稿日期:2006-10-26
#59#Vo1.26,No.4预 测2007年第4期
命题1 当Rz一定时,分别在两个区间内(Rz[
义可靠性为重复测量或者试验能够获得相同结果的程度;工程领域里可靠性指的是元件或者系统在给定时间内,在允许的运行条件下,能够正常发挥其功能和作用的概率致性的一种度量
[8,9]
[7]
Rd与Rz\\Rd),FU总是|Rz-Rd|的单调增函数。
证明 对于任意三个正态分布,f1(x)~N(0,R1),f2(x)~N(0,R2),f3(x)~N(0,R3),假定有R1 * 2 2 2 2 2 2 1 ;天气预报领域将它定义 为给定预测概率下观察到的概率与预测概率的一 。 这些定义可以看作是预测与真实情况的相对一致性。供应链管理中通常假设是由干扰(白噪声)造成了预测值与真实需求的不一致(残差)。对于无偏预测,残差是均值为零的正态分布。因此考虑将干扰(本文仅针对正态白噪声)作为基准,定义预测不可靠性为残差序列与白噪声序列的相对一致性。 定义1 预测不可靠性(FU)描述的是预设的正态白噪声与预测残差分布密度函数的累积绝对差,令fd(x)与fz(x)分别为它们的分布密度函数,则 FU= 11 -] 1 Q|f(x)-f(x)|dx =2Q|f(x)-f(x)|dx=2Q|f(x)-f(x)|dx 0 1 2 t*0 1 2 +] *t +] 12 以f1(x)为噪声,则 FU(f3)-FU(f2) =2( 1 1 Q ] |fd(x)-fz(x)|dx/2 由定义1给出的不可靠性有如下特性:(1)FU是残差序列与正态白噪声序列之间的不一致性的一种度量; (2)fd(x)与fz(x)相交于两点,FU即为两条曲线所夹的面积,且FUI[0,1]。(因为:0[fz(x)|dx[ -] 1 -]1 Q(f(t)-f(t))dt-Q(f(t)-f(t))dt) 0 1 3 x10 1 2 1 1 x2 即 FU(f3)-FU(f2) =2( Q|f(x)-d ] 1 Q(f(t)-f(t))dt+(f(t)-f(t))dt)>0Q 1 x 0 23 x2x1 13 Q ] fd(x)dx+ -] Q ] 这样FU(f2) =2( 1 1 1 2 1 12 fz(x)dx=2); 1 (3)当fd(x)=fz(x),有FU=0,预测是完全可靠的;不可靠性随着fd(x)与fz(x)偏差的增大而增大,FU的值越大,预测越不可靠。 为了方便计算和使用,给出FU的另一个替代性定义。令Rz与Rd分别是正态白噪声与预测残差的标准差。 定义2 对于无偏预测,预测不可靠性(FU)指的是Rz与Rd的绝对差与max(Rz,Rd)的比值,不妨设Rd,Rz>0,则 FU=|Rd-Rz|/max{Rd,Rz} (1)FUI[0,1),当Rz=Rd,FU=0;当RzmRd 或者RznRd,FU→1; (2)显然FU是Rd的增(减)函数,如果Rd>Rz (Rd 22 2 2 2 2 1 1 Q(f(t)-f(t))dt-(f(t)-f(t))dt)>0Q 0 1 3 x10 1 2 1 2 2 x2 即FU(f1)>FU(f2),残差方差从R2减小到R1时不可靠性在增大。因此当Rz一定时,在独立的区间内(Rz[Rd与Rz\\Rd),Rd偏离Rz越大,可靠性越低。命题得证。 命题1表明可以使用FU代替FU。因为当Rz给定时FU分别在两个区间内(Rz[Rd与Rz\\Rd)是|Rd-Rz|的单调增函数,当Rd偏离Rz越远,可靠性越低。因此|Rd-Rz|=F 2 -1 2 2 1 (FU),即将|Rd 1 2 -Rz|表示为FU的单调增函数。FU是|Rz-Rd| 华中生,等:基于ARIMA(p,1,q)过程的MMSE预测可靠性研究 的单调增函数,即FU=g(|Rz-Rd|)(分别在Rz[Rd与Rz\\Rd内),因此有FU=g(F 2 1 -1 1 证明 令^et(h)=xt+h-x^t(h),将xt+1减去x^t(1)式得到^et(1),将^et(1)代入xt+2-x^t(2)获得^et(2),将^et(1)与^et(2)代入xt+3-x^t(3)而获得^et(3),以此类推,得到^et(1),^et(2),^et(3),只是zt+k的线性函数,1[k[h。证毕。由命题2容易得到下面的推论。 推论1 ARIMA(p,1,q)的MMSE预测是无偏预测。 证明 令得到的预测残差为G(zt+k),1[k[h,只要h是有限值,则期望EG(zt+k)=0,因此预测是无偏的。证毕。 基于假设每期的干扰独立且同分布,Zt~WN(0,Rz),由于var(^et(h))\\Rz,当且仅当h为1时等式成立。不妨设Rz>0,由定义2有预测可靠性的度量式为 FR=Rz/ var(e^t(h)) 由于G(Zt+k)是zt+k的线性函数,上式中可以消去Rz。显然,FR满足特性:FRI(0,1],FR是var(^et(h))的减函数。在此度量下可以得到两个推论。 推论2 在对ARIMA(p,1,q)需求过程的MMSE预测中,单步预测是最可靠的。 证明 因为^et(1)=xt+1-x^t(1)=zt+1,所以var(^et(h))=Rz,因此有FR=1。证毕。 推论3 ARIMA(p,1,q)需求过程的MMSE预测可靠性随预测期的增长而下降。 证明 对特定的ARIMA(p,1,q)过程,预测期每增加一期都将引入一个新的干扰,由于方差的累积性,预测残差的方差必将增大。当预测期为h时预测误差为Gc(zt+k),增加一期时误差变为 Gc(zt+k)+U(根据FR的度量式,不难得到预测可靠性在降低。证毕。推论3与经验性结论相符4 数值分析 由于对ARIMA(p,1,q)过程的一般性以及相似结构,令p=d=q=1,<1=0.5,即ARIMA(1,1,1)。h=1,var(^et(h))=Rz;h\\2,var(^et(h))=R 2z 2 h h-ij=0 h-i-1j=0 [11] 2 2 2 (FU)), 1 2 即在两个独立的区间内(Rz[Rd与Rz\\Rd),FU是FU的单调增函数。因此可以在两个独立的区间内使用FU来表示FU。 3 ARIMA(p,1,q)过程的预测可靠性度量 一般的ARIMA(p,d,q)表示 d d[10] 2 1 为 <(B)(1-B)(Xt-L)=H(B)Zt 其中Xt是t期的需求,(1-B)Xt代表Xt的d阶差分,L是d阶差分后过程的均值,Zt是独立同分布随机噪声序列。B是时间序列后向算子,BZt=Zt-1,BZt=Zt-j,<(B),H(B)是B的多项式,<(B)=1-<1B-<2B-,- x^t(h)=E[xt+h|xt,xt-1,,] 其中MSE= 2 q 2 p j E (xt+h-x^t(h))。以t表示当前 2 期,则i>0时有 Ezt+i=0; Ext+i=x^t(i); Ezt-i=zt-i; Ext-i=xt-i第一式表示将来的干扰其期望值为零;第二式表示对未来的预测值即为其条件期望;后两式表示已经发生的干扰以及观察值的期望等于其本身。3.2 ARIMA(p,1,q)过程预测可靠性 通常极少有d>2,当d=2时推导过程类似于d=1,本文选择d=1。ARIMA(p,1,q)用xt=(1+<1)xt-1-(<1-<2)xt-2-,-( 。 E(E i=1 <-H1E<1),因此 j 1 j 2 FR=1Eh[1-H1+<1(H1-<1)] h-i2(1-<1) 2 i=1 1[h[10,-1[H,根据计算作图。图1表示1[1随着预测期的增长,预测可靠性下降,即推论3。 #61#Vo1.26,No.4预 测2007年第4期 图1 可靠性随预测期h变化 命题3 当h固定,0[<1[1,0[H1[1时,对于ARIMA(1,1,1),FR是H1的增函数。 证明 令FR当h与j给定时, h-i-1 -1 所以其h项之和依旧成立 = j E hh-i-1 h-i-1 i=1 [(1-H) h-i E j=0 <+< jh-i ], 2 EE h hh-i-1 [(1-H1)[(1-H2) i=1 EE <+<<+< -1 j jh-j ]i<]i 2 2 j=0h-i-1 h-j j=0 E j <与<就是定值。因此i变化 h-i i=1 j=0 时,[(1-H)H1>H2,有 h-i-1j=0 E j j=0 <+< ]i的值决定于H,显然当 h-i-1j=0 2 [(1-H1)E<+< h-i ]<[(1-H2)E<+< 2 i j h-i ]i 2 因此当<和h给定时FR是H的减函数,也就是说FR是H的增函数。证毕。见图2。计算表明{0[<1,-1[H[<1[0,-1[H1[1}G{-11[-<1}时结论依然成立。 图2 可靠性随H1变化 5 预测精度与可靠性的关系 表示时间序列预测精度的方法有很多,如PE(PercentageError),MPE,MAPE(MeanAbsolutePer-centageError),MAD(MeanAbsoluteDeviation),MSE,RMSE(RootMeanSquareError),MFE(Mean ForecastError)等等,可以参见Makridakisetal的文#62#章。精度与可靠性的不同在于:首先,精度反映误差的平均趋势或者总体误差,是基于过程均值的;它是事后对方法的检验;一般不用考虑时间的先后顺序,是计算在时间段内预测方法宏观上的表现。可靠性考虑的是在无偏预测下研究残差的分布,基于特定的需求过程本身。其次,在涉及精度计算时,预测期通常是定值,当前期t不断更新,预 [12] 华中生,等:基于ARIMA(p,1,q)过程的MMSE预测可靠性研究 测是滚动预测,例如简单移动平均是单步预测。预 测是在基于不断出现真实需求发生的情况下,向后递推来进行的。可靠性考虑的是当前期t不变而预测期不断变化的问题,是知道已有的p期真实值(如本文使用两期数据来预测未来多期的需求)与q期干扰就可以对未来不同长度时期的需求进行预测。但是精度与可靠性又有关联性,Stewart定 [13] 性地指出预测精度是可靠性的函数。 下面给出一个仿真实例,令<=0.5,xt-1=10000,xt=9400,H=0.2,Rz=10,h从1变化到10,仿真出ARIMA(1,1,1)的真实值与预测值序列。 Ct1 1010050010003000500070001000020000 h13.8079.04811.83312.20412.13011.93412.07912.23512.18812.115 21.89923.74720.00921.39620.41120.60620.74521.15820.89820.96 31.271 32.11726.69528.38227.71128.02927.85928.63628.18428.266 11.42.31.34.33.33.34.34.34.34.4001092847249884793015863357455 26.51.34.40.39.38.39.40.39.40. 为了消除随机数产生的误差,需要多次循环,令次数为Ct,计算 C Ei= m=1 E t (xt+i-x^t(i))m 2 令ei=Ei/Ct(i=1~h),则ei可以看作单期的 MAD值,代表预测精度,计算结果见表1。可见,当Ct大于100时ei随h的增大而增大。当Ct\\1000时,由于循环消除了正态分布数产生的随机性影响,ei趋于稳定(每个循环做了多次计算,只列出了一种结果,因为所有计算结果数据变化趋势相同)。 表1 ei随预测期变化的计算值 5168819969061506634278368616034 23.60.38.45.44.43.44.45.44.45.6906436770067417256189028326042 23.64.43.49.48.47.48.49.48.49.7098396764156947908785466757597 26.65.46.53.53.52.53.53.52.53.8216299982336164166141456925677 941.44063.20451.44456.92557.45256.15157.05557.37456.74557.27 1047.64.54.60.60.59.60.60.60.60.907255545592688707795905329716 选择Ct=10000,做此循环十次,计算ei的平均值ei|Ct=10000;同时计算 hvar(e^t(h))ei|Ct=10000 11012.180 216.40120.953 预测可靠性,结果见表2。 var(e^t(h)),它代表 表2 3 21.89228.240 var(e^t(h))与ei|Ct=10000426.68034.425 530.91839.850 634.72844.791 738.19749.253 8 41.39453.301 944.37057.017 1047.16460.542 可以看出ei与var(e^t(h))保持高度的一致:h增大,精度降低,可靠性下降。6 可靠性对预测期决策问题的影响 预测期的研究是由许多现实问题引起的,如库存管理、生产规划、设备置换以及现金流管理等等。一方面,研究者都想找到一个相对短的预测期,因为随着预测期的增长,预测变的不可靠;另一方面,决策者希望有相对长的预测期,这样可以基于预测提前作出决策,如生产安排、人员调配以及市场策划等。因此如何选择合适的预测期成为一个两难的问题。早期文献[14]考虑了一个多期、滚动生产规划中预测期的决策问题。 考虑常用的安全库存表达式:ss=L+kR,令L=x^t(h),k是服务水平系数,则R=var(e^t(h))随着可靠性的降低,安全库存水平将上升,库存成 本增加。为此,在进行预测期决策时,企业根据自己库存成本的预算,预测值以及服务水平,可以确定一个R的可接受范围,进而可以确定var(e^t(h))/Rz的可接受水平。如本文例子中若选择var(e^t(h))/Rz[4,则0.25[FR[1,由表2得到hI[1,7]。7 总结 本文从预测残差的预设分布出发,提出了无偏需求预测的不可靠/可靠性的概念与定义,分析了它们的特性,并提出了预测可靠性的度量方法;以需求预测中常用的ARIMA(p,1,q)过程MMSE(最小均方差)预测为背景,分析了预测可靠性与精度的关系以及特定的模型参数与可靠性之间的关系,并进行了仿真,同时考虑了可靠性对预测期决策的影响。 (下转第80页) #63#Vo1.26,No.4预 测2007年第4期 情况。1999年全国旅游业受/禁折令0冲击,收入减少10亿;保险、邮政、餐饮、宾馆、娱乐休闲等相关产业收入减少额度难以估量。因此在2004年又 [13] 默许航空公司多级折扣价格体系。5 结论 本文分析了内生价格歧视的特征,构建了多子市场价格歧视模型。理论解释了内生价格歧视对厂商利润、产出、消费者剩余和社会福利的正向影响。基于该理论,详细讨论应用内生价格歧视在民航业中的多级票价应用。本文局限于使用线性模型,旨在说明问题,未来研究应扩展到曲线模型一般形式,并收集必要的数据,给出实证依据。参 考 文 献: [1]KathleenC,DennisC.Teachingpricediscrimination: someclarification[J].SouthernEconomicJourna,l1999,66(2):466-480.[2]LeontiefW.Thetheoryoflimitedandunlimiteddiscrim-i nation[J].QuarterlyJournalofEconomics,1940,54:490-501. [3]SchmalenseeR.Outputandwelfareimplicationsofmo- nopolisticthird-degreediscrimination[J].AmericanEco-nomicReview,1981,71:242-247. [4]VarianHR.Pricediscriminationandsocialwelfare[J]. AmericanEconomicReview,1985,75:870-875.[5]SchwartzM.Thirddegreepricediscriminationandou-t put:generalizingawelfareresult[J].AmericanEconom-icReview,1990,80:1259-1262. [6]唐小我.三度价格歧视的数量分析[J].管理工程学 报,1999,13(1):37-40.[7]HausmanJA,Mackie-MasonJK.Pricediscrimination andpatentpolicy[J].RandJournalofEconomics,1988,19:253-265.[8]BorensteinS.Hubsandhighfares:dominanceandmar-ketpowerintheUSairlineindustry[J].RandJournalof Economics,1989,20:344-365.[9]DanaJD.Advance-purchasediscountandpricediscrim-i nationincompetitivemarkets[J].JournalofPoliticalE-conomy,1998,106:395-422.[10]BelobabaPP.Anoverviewofseatinventorycontrol[J]. TransportationScience,1987,21(2):63-73.[11]MorrisonSA,WinstonC.Thedynamicsofairlinepr-i cingandcompetition[J].AmericanEconomicReview,1990,80(2):389-393. [12]MorrisonSA,WinstonC.Causesandconsequencesof airlinefarewars[J].BrookingsPapersonEconomicAc-tivity,1996,80(3):345-362. [13]康自平,杜伟.我国民航运价管制放松与再管制[J]. 财经问题研究,2004,12(12):81-84. (上接第63页)参 考 文 献: [1]LeeHL,PadmanabhanV,WhangS.Informationdistor-tioninasupplychain:thebullwhipeffect[J].Manage-mentScience,1997,43(4):546-558.[2]ChenF,DreznerZ,RyanJ,eta.l.Quantifyingthebul-l whipeffectinasimplesupplychain:theimpactoffore-casting,leadtimes,andinformation[J].ManagementScience,2000,46(3):436-443.[3]GravesSC.Asingleiteminventorymodelforanonsta-tionarydemandprocess[J].Manufacturing&ServiceOp-erationsManagement,1999,1(1):50-61.[4]LeeHL,PadmanabhanV,WhangS.Thebullwhipeffect insupplychains[J].SloanManagementReview,1997,38:93-102. [5]李刚,等.牛鞭效应与生产平滑模型有效性问题[J]. 管理科学学报,2004,7(1):1-18.[6]ChristophK,BurkhartF.Instrumentalandtest-retestre-liabilityofsaccadicmeasures[J].BiologicalPsychology, 2005,68(3):201-213. [7]EbelingCE.Anintroductiontoreliabilityandmaintain-abilityengineering[M].McGraw-HillInternationalEd-i tions,1997.487. [8]MurphyAH.Whatisagoodforecast?Anessayonthe natureofgoodnessinweatherforecasting[J].WeatherForecast,1993,8:281-293. [9]JolliffeIT,StephensonDB.Forecastverification:a practitioner.sguideinatmosphericscience[M].WileyandSonsLtd,2003. [10]BoxGEP,JenkinsGM.Timeseriesanalysis,forecas-tingandcontrol[M].USA:Holden-DayInc,1976.[11]SureshC,VernonNH,SureshS.Forecastsolutionand rollinghorizonsinoperationsmanagementproblems:aclassifiedbibliography[J].Manufacturing&ServiceOp-erationsManagement,2002,4(1):25-43.[12]MakridakisS,AndersenA,CarboneR,eta.l.Theac-curacyofmajorforecastingprocedures[M].NewYork: JohnWiley,1984.[13]StewartTR.Improvingreliabilityofjudgmentalforecasts [A].InArmstrongJS,ed.PrinciplesofForecasting:AHandbookforResearchersandPractitioners[C].Klu-werAcademicPublishers,2001.81-106.[14]KleindorferP,KunreutherH.Stochastichorizonsforthe aggregateplanningproblem[J].ManagementScience,1978,25(5):1020-1031. #80# 因篇幅问题不能全部显示,请点此查看更多更全内容