第2期(总第180期) 山西水利科技 No.2(Total No.180) 2011年5月 SHANXI IIYDRoTECHNICS Mav.201l 1006—8139(201 1)02—09—03 基于RBF神经网络的工业取水量预测研究 褚桂红 (山西省水利水电科学研究院山西太原030002) 摘要:介绍了径向基函数(RBF)神经网络的结构、原理和训练算法。以某市为研究对象,建 立了RBF神经网络工业取水量预测模型,采用最近邻聚类学习算法确定径向基函数的宽 度、聚类中心和权值。结果表明:RBF模型具有较强的非线性处理能力和逼近能力,且结构简 洁、学习速度快、预测精度高,泛化能力强,克服了BP神经网络学习过程收敛过分依赖于初 值和可能出现局部收敛的缺陷。 关键词-RBF神经网络;工业取水量;预测 中图分类号:TP183 文献标识码:A 水资源短缺已成为制约我国工业发展的重要因素,而要 于BP网络,能够避免局部收敛,实现快速全局收敛 。 实现经济的快速发展,就必须解决好水的供需关系。需水量 ‘p1(1I X-c.11) 预测是制订供水决策的重要参考目标,可为水资源规划和管 理提供必要的依据。工业取水量预测可以采用BP神经网络 预测模型,但该模型采用的是沿梯度下降的搜索求解算法, 这就不可避免地存在收敛速度慢、容易陷入局部最优等缺 陷。由Moody J和Darken C于20世纪80年代末提出的径向 基函数(Radial Basis Function,RBF)神经网络 是一种典型 ‘Ph(Il X-C h lI) 的局部逼近人工神经网络,能够避免传统的BP神经网络的 输入层 隐含层 输出层 缺点,因而得到了更广泛的应用。本文建立了基于RBF神经 图1 RBF神经网络结构图 网络的T业取水量预测模型,并以某市为例进行了研究。 1.2网络原理 1 RBF神经网络 RBF神经网络的基本思想是:把径向基函数作为隐单元 的“基”,构成隐含层空间,隐含层对输入矢量进行变换,将低 径向基函数(RBF)神经网络是一种以函数逼近理论为基 维的模式输入数据变换到高维空间内,使得在低维空间内的 础的三层前馈网络,具有很强的生物学背景,也是当前国际 线性不可分问题在高维空问内线性可分[43。径向基函数神经 学术界前沿研究领域,在模式识别、图像处理、预测预报、故 网络(RBF)是一种前馈神经网络,输入层节点只传递输入信 障诊断、信号处理、优化计算、专家系统与人工智能等方面得 号到隐层,输出层通常是简单的线性函数-j .,隐层节点常由 到了广泛的应用 t33。 , 高斯函数构成。 1.1 RBF网络结构 r l l{2 1 RBF网络的结构与三层BP网络相似,分为输入层、隐含 ( ) (1 II1): 一l 2 J} :l,2,…,h 层和输出层,如图1所示。输入层节点传递输人信号到隐层, 式中: 为n维输入向量;c,为第 个隐含层节点的基函 隐层节点由像高斯函数那样的辐射状作用函数构成,而输出 数中心,与 具有相同的维数的向量;lZ是感知单元的个数, 层节点通常是简单的线性函数。RBF网络的最显著的特点是 也就是隐含层节点的个数; 为第 个隐含层节点的基函数 隐节点的基函数采用距离函数,使用径向基函数作为激活函 宽度参数;lI 一,ll为矩阵欧式范数,通常表示 与c 之间的 数。径向基函数关于维空间的一个中心点具有径向对称性,而 距离; ( )在e,处有一个唯一的最大值,随着l l一.1I的增 且神经元的输入离该中心点越远,神经元的激活程度就越低, 大,‘9( )会迅速衰减到零。 即径向基函数对输入信号在局部产生响应。函数的输入信号 对于给定的输入,只有一小部分靠近 的中心被激活。 靠近函数的范围时,隐层节点将产生较大的输出,因此, 设输入层的输人为( ,, …, …,%),实际输出为(Y=y , RBF网络无论在逼近能力、分类能力和学习速度等方面均优 Y2,…,YJ,…,yM)。输入层实现从 一 ( )的非线性映射,输出 [收稿日期]2011-3—25 [修回日期]2011-3—29 [作者简介]褚桂红,女,1980年生,2010年毕业于西安理工大学,硕士研究生,助理工程师,主要从事水资源高效利用研究。 ・9・ 第2 180期 月褚桂红基于RBF神经网络的工业取水量预测研究 :No.2(Total No.180) May.2011 层实现从 ( )— 的线性映射。 ^ 系相当困难。RBF神经网络具有并行处理、容错性和很好的处 理非线性问题等多种优良性能,可实现任意函数的逼近。基于 k=l,2,…,m RBF网络输出为: : J=J RBF神经网络的工业取水量预测模型,通过对样本的学习,可 以实现工业取水量预测影响因子与取水量预测的非线性映射 关系。 2.2数据归一化处理 式中: 为隐含层节点. 至输出层节点k的链接权值; .为 隐含层节点的输出值;m为输出层节点数。 确定RBF网络的聚类中心Cj,权值 一后,就可求出某 输入对应的输出值。 从构造RBF网络的结构可以看出,构造训练RBF网络 采用某市1990-2000年共11年的资料,以1990-1997年 1.3网络学习方法 8年的资料为训练样本,1998—2000年3年的资料为检验样本, 训练前需对输入指标进行无量纲化处理,即数据的归一化。 一 — 的过程,就是通过学习确定隐含层神经元的数目和每个隐含 层神经元的中心、宽度以及输出权值的过程。根据径向基函 数中心选择方法的不同,RBF网络有多种学习方法,其中随 :— ‘ —— ~一 ~式中: 为归一化后输入或输出值;x/为输入或输出的样 机算法和自组织学习算法适用于静态模式的离线学习,不能 用于动态输入模式的在线学习,网络隐含层单元的节点数要 事先人为确定,而最近邻聚类学习算法是一种在线自适应聚 类学学习算法h]。此算法隐含层单元节点数不需要事先人为 本值; — ~为样本数据中变化范围内的最大值和最小值。 3预测结果及分析 根据资料条件,选用8个取水量预测因子作为径向基函 表1归一化后的样本数据 确定,随着输入样本的变化,隐 含层单元的节点数也随之而变, 训练样本学习结束,隐含层单元 的节点数随之确定下来。 2基于RBP网络的工业取水量 预测模型构建 年份 T业总 总复用 总用水量 万元产值 万元产值 总复用率 耗水量 排水量 产值 1990 0.00 水量 0.00 0.OO 取水量 1.00 用水量 0.73 0.90 0.67 0.55 1991 1992 1993 1994 O.O3 0.20 0_18 O.31 O.58 0.75 0.73 0.57 0.57 0.74 O.69 0.55 O.87 O.59 O.52 O.37 1.0O 0.79 0.79 0.57 O.92 0.93 0.94 O.92 O.88 O.80 0.74 0.87 0.22 0.26 0.OO O-21 影响工业取水量预测的因 子很多,建立这些影响因子与取 水量的精确数学模型较为困难, 而神经网络具有广泛的从输入 1995 1996 0.43 0.5O 0.40 1.0O 0.41 1.00 0.49 O.38 0.40 0.54 0.91 0.93 1.OO O.62 0.41 0.7O 到输出的映射能力,是一种能够 找到正确反映现实系统输人、输 出及它们之间外在关系的有效 1997 O.65 0.94 0.93 O.24 0.40 O.93 0.52 0.66 工具。神经网络应用于预测领域,最普遍采用的是多层前馈 神经网络模型,即BP网络。BP网络采用反向传播算法,不仅 收敛速度慢,而且会遇到局部极小值问题,因此这里采用径 数神经网络预测模型的输入,隐含层的节点数由最近邻聚类 算法通过样本的学习确定,同时得到RBF网络连接权值,输 出层输出工业取水量。训练前需对输入指标进行归一化处 理,归一化后的样本数据见表1。 向基函数(RBF)神经网络模型。 2.1 工业取水量影响因素分析 预测模型中网络训练样本输入层节点数为8个,输出层 节点数为1个,利用Matlab软件编程对网络进行训练,经过 RBF神经网络工业取水量预测模型是建立在历年用水 量的基础上,经过样本学习,确定网络模型结构,因此在进行 取水量预测之前,应先对历年用水量进行分析。 工业取水量与用水户的 生产规模、产业性质、技术水 关。通过对某市工业取水量 值/万元 1998 1321874 训练网络误差达到误差要求。用训练好的网络预测1998、 1999和2000年的工业取水量,取水量预测因子见表2。 表2工业取水量预测因子 平、用水效率、用水定额等有 年份 工业总产 总复用水量 总用水量 万元产值取水 万元产值用水 总复用 耗水量 排水量 顷 141085 嘎 152900 量/(m3/万元) 量/( /万元) 率/% f页 89.4 1156_7 92.27 3524 嘎m3 8293 变化规律进行分析,得到影 响工业取水量的主要影响因 素有:工业总产值、工业复用 水量、工业总用水量、万元产 1999 1433529 2000 1537755 132490 121140 142981 130824 73.2 70.8 997.4 850.7 92.66 92.60 5024 4857 5471 4827 值取水量、万元产值用水量、总复用率、排水量和耗水量8项 指标,这些取水量预测影响因子与丁业取水量之间呈复杂的 利用训练好的网络对某市1998、1999和2000年工业取 水量进行预测检验,预测结果见表3。由预测结果可知,RBF 非线性关系,要用精确的数学函数关系表达这样的非线性关 ・神经网络预测精度均高于BP神经网络,这说明RBF网络模 l0・ 第2期(总第180期) 2011年5月 山西水利科技 SHANXI J日【YDRoTECHNICS No.2(Total No.180) MaV.20l1 表3模型预测结果 BP模型 RBF模型 年份 工业总取水量实际 值/万m 预测值 ,_) m 相对误差 /%) 6.04 4.62 一3..【8 残差 f m3 714 485 -346 预测值 f。矗m3 11327 10193 11088 相对误差 /% 4 13 2.84 —1.87 残差 /7i m 488 298 -204 1998 1999 2000 11815 10491 10884 11101 10O06 1123O 型具有较高的预测精度,模型泛化能力强,可用于工业取水 量预测等领域。 4结语 [3]魏海坤.神经网络结构设计的理论与方法[M].北京:国防 工业出版社,20o5:46—73. [4]高隽.人工神经网络原理及仿真实例[M].北京:机械工 业出版社,2003:55—63. I5 l M J D Powel1.Radial basis functions for muhivariable in— 本文利用RBF神经网络强大的非线性逼近能力建立了 RBF神经网络取水量预测模型,该模型有较强非线性处理能 力和逼近能力,采用最近邻聚类学习算法选取聚类中心,具 有学习时间短、网络运算速度快、性能稳定等优点,避免传统 BP神经网络容易陷入局部最优的缺点。 [参考文献] l 1 j Moody J and Darken C.Fast learning in networks of locally tuned processing IJ J.Neural Computation,1989(1):281— 289. terpolation:a review[C]J C Mason G Cox.Algorithms orf approximation.New York:Clarendon Press,1987:146—167. [6]C A Micchelli.Interpolation of scattered data Distance ma— trices and conditionally positive definite functions[Jj.Con- structive Approximation,1986(21:11-22. [7]刘旭,于国祥,沈西挺.基于神经网络德尔预测模型的比 较研究[J].河北省科学院学报,2007(12):7-12. [8]朱明星,张德龙.RBF网络基函数中心选取算法的研究【J】. 安徽大学学报(自然科学报),2000,24(1):74—78. [2]焦李成.神经网络系统理论[M].西安:西安电子科技大学 出版社.1996:26—36. Study on the Prediction of Industrial Water Demand Based on the RBF Neural Network CHU—Gui hong Abstract:This paper introduces the structure,principle and training algorithm of RBF Neural Network, taking a city as research subject,sets up the mc・del of water demand forecasting for industry based on RBF Neural Network,and determines the width,clustering center and weight of RBF by the nearest neighbor clustering algorithm.The results showed that the RBF Neural Network has strong nonlinear processing ability and approximation capability,moreover it has simple structure,fast learning,high precision,strong generative ability, and it overcomes the shortcomings of depending on the initial value excessively and local convergence of BP Neural Network. Keywords:RBF neural network。industrial water demand,prediction