您好,欢迎来到好走旅游网。
搜索
您的当前位置:首页一种新的基于动态SOFM的神经网络聚类模型

一种新的基于动态SOFM的神经网络聚类模型

来源:好走旅游网
维普资讯 http://www.cqvip.com 第25卷第4期 广西师范大学学报:自然科学版 Journal of Guangxi Normal University:Natural Science Edition Vo1.25 No.4 Dec.2007 2007年12月 一种新的基于动态SOFM的神经网络聚类模型 陆宇曼,郭会林,李陶深,苏一丹 (广西大学计算机与电子信息学院,广西南宁530004) 摘要:提出一种动态增删自组织映射(DGDSOM)神经网络,给出该模型的聚类算法描述及实现过程。定义 了聚类节点信任度,并根据竞争结果、信任度、中心相似度,制定节点的增删策略,通过动态评价并变动节点, 提升聚类效果。实际的聚类分析应用结果表明,该算法可以得到准确的聚类结果。 关键词:DGDSOM;聚类;SOFM;节点信任度 中图分类号:TP391 文献标识码:A 文章编号:1001—6600(2007)04—0257—04 聚类分析是一种无教师监督的学习方法,其基本的指导思想就是最大程度地实现类内相似度最大,而 类之间相似度最小。自组织特征映射网络(self—organizing features map,SOFM)是Kohonen提出的一种 神经网络聚类方法[】],它模拟大脑神经系统自组织特征映射的功能,通过网络结构的自组织过程,自动地 对输入的数据模式进行聚类_2 ]。传统SOFM模型的局限性明显_4],竞争层的神经元个数在网络训练开始 时必须设定,即必须预置聚类数。在没有先验知识的情况下,一个数据集合的聚类数是不确定的,因此由 SOFM得到的聚类结果并不太理想,甚至出现错误。此外,SOFM在训练过程中网络结构固化,不能灵活 调整。本文针对SOFM模型存在的不足,提出一种新的动态增删自组织映射(DGDSOM)神经网络模型。 1 DGDSOM模型 本文提出的DGDSOM模型结构如图1所示,它包含了输入层、竞争层和输出层以及输出层与竞争层 之间的反馈模块 。该模型的输入层与传统的SOFM模型相同;把输出层独立出来是因为输出层需记录 竞争层的所有历史输出结果,并且输出层通过反馈模块影响竞争层结构。网络的竞争层在初始时没有神经 元节点,在学习过程中逐步建立并动态调整竞争层网络结构,因此竞争层的建立依赖于神经元节点的增加 和删除操作。当某个数据模式提供给输入层 时,首先计算该模式与现有竞争层的神经元 节点之间的相似度,若相似度均小于设定的 阈值,则认为此模式新增一个竞争层神经元 节点,并将该模式的向量值作为节点的初始 权向量。模型中增加节点的策略采用了文献 [6]提出的树型增长的方法,而竞争层节点的 删除策略则通过引入节点信任度的概念来实施节点删除操作。 图1 DGDSOM模型结构 Fig.1 DGSOM model structure 节点信任度是指通过评价节点所产生的聚类效果优劣,决定节点存在的合理程度的评价值。这是删除 节点的依据。节点信任度由熵值和模式个数决定:熵值反映了聚类效果的好坏,而模式个数评价的是当前 聚类的聚集程度有多大,由这两者计算得到的节点信任度可以定量地反映该节点存在的合理性和准确性。 如果节点的信任度低于阈值,则认为此节点产生的聚类效果不佳,就将此节点从竞争层中删除,而将原属 于此节点的数据模式重新进行聚类。通过节点删除操作,逐步调整竞争层的节点数和网络结构,最终建立 起稳定的网络结构,学习停止。 收稿日期:2007—04—25 基金项目:广西自然科学基金资助项目(桂科自0624006) 通讯联系人:李陶深(1957一),男,广西邕宁人,广西大学教授。E—mail:tshli@gxu.edu.cn 维普资讯 http://www.cqvip.com 广西师范大学学报:自然科学版 第25卷 DGDSOM模型的最大特点在于竞争层的网络结构在网络训练过程中逐步建立,并且通过动态评价、 反馈而增删神经元节点。因而,根据网络训练得到的经验知识确定竞争层神经元节点数目的过程,也就是 网络结构趋于合理、聚类结果趋于优化的过程。 2 DGDSOM模型聚类算法的设计实现 DGDSOM模型聚类算法的实现过程描述如下: 步骤1:预处理各输入的数据模式:z 一(扎,孙,…, ) ,i一1,2,…,M,使各分量的值均在Eo,132: 间。依次输入这些数据模式。 步骤2:参数初始化。聚类过程采取完全的自组织机制,初始权值根据聚类节点的第一个数据模式确 定。学习速率a—a。一O.9,在起始阶段,学习速率较快,随后逐渐减小。 步骤3:竞争。即计算模式z 与每个聚类节点的权向量之间的欧氏距离: 厂 ——————一z 一 一√ 一 。 若ll 一 ll—rain Il五一 ll≤ ,则权值为W 所代表的节点竞争获胜,将z 并入这一类;否则,生成一 个新的聚类节点,五为该节点的第一个数据模式,赋权值W + 一五。 步骤4:权值与学习速率更新。采用以下计算公式来计算权值和学习速率: l一 。 1 +l 7- 一1 e}~ 其中,a随着并入该节点的输入数据模式数目i的增长,先减小较快,然后负增量越来越小,最终a缓慢趋 于O。 步骤5:计算信任度。信任度是衡量一个节点所有输入模式聚类效果的指标,通过对熵值的计算得到。 1,Ⅳ≤6l, N P(fJ,Xi) )一{ ̄p(cj,xi)l。g( l × ,6 <Ⅳ< ∑simi(c ) k一1 log(Ⅳ)×log(1og(Ⅳ)) simi(cj,z^):COS(f,,z ), HⅣ一H( )一 , lHN,Ⅳ≥6 , 量z 的相似度,Ⅳ为并入该节点的数据模式个数。 其中, 为该节点中心,且c 一 。S(f )为 代表的节点的信任度。simi(c ,xk)表示节点中心c 与输入向 当N>b 时,聚类的变化趋势是较稳定的,模糊函数升半Cauchy分布: 1 H( )一 , 较好描述了这一变化趋势。当N>b 时,节点信任度值完全取决于H 并趋近于1。应用此式于信任度的 计算可反映模式个数对聚类效果的影响。 N 每当聚类节点增加一个数据模式时,原节点中心c 偏移,此时, simi(c ,z )须重新计算,显然,在Ⅳ Ⅳ 较大的情况下,计算量非常大。可采用计算增量的方法对25 simi(c ,z )近似处理: Ⅳ f∑simi(c ,z ),Ⅳ≤6; simi( 一 lH(Ⅳ)∑simi(f , )+simi(c ,XN),N>b。 维普资讯 http://www.cqvip.com

第4期 陆字曼等:一种新的基于动态SOFM的神经网络聚类模型 259 步骤6:比较信任度、中心相似度,决定节点保留或删除。定义第i个节点与第 个节点的中心相似度 为SC =simi(c ,c ),1≤ < ≤户,信任度阈值 ,中心相似度阈值r。节点删除策略为:当 ( )< ,则删除 第i个节点;当SC <r,则删除信任度 (c)较小的一个节点。如果无删除节点,转步骤3;否则删除节点,将 该节点的数据模式依次输入网络,转步骤3逐步执行。 步骤7:若所有的输入模式都输出完毕,则聚类过程结束。 3应用实例 我们选取了2004年广西部分县(市、区)国民经济基本情况作为实验数据[7],对本文的模型及算法的 性能进行验证分析。具体的实验做法是:采用传统的SOFM网络模型算法[8]和DGDSOM模型算法对89 个有14个属性指标的县聚类。表1和表2分别是两种算法的聚类结果。通过比较,可以得出以下结论: ①通过计算发现,玉州、平果和凭祥与其他各县的经济状况相似程度都不高;DGDSOM算法能够很 好地识别出这3个奇异的数据并单独形成一个类,而SOFM网络模型算法的聚类分析没有发现这3个特 别的数据。因此DGDSOM产生的聚类更加合理。这从两者的平均信任度比较上可以得到进一步验证。 表1 DGDSOM算法聚类结果 Tab.1 Clustering results of DGDSOM algorithm 类别DGDSOM 第1类邕宁县武鸣县横县宾阳县柳江县柳城县鹿寨县临桂县灵川县全州县兴安县永福县平乐县荔浦县恭城 瑶族自治县苍梧县藤县岑溪县合浦县灵山县浦北县平南县桂平县容县陆川县博白县北流市八步区宜 州市兴宾区 第2类上林县隆安县马山县融安县三江县融水县阳朔县灌阳县龙胜各族自治县资源县蒙山县上思县钦南区 钦北区港南区港北区覃唐区福绵区兴业县田阳县田东县昭平县钟山县富Ji『瑶族自治县南丹县大化瑶 族自治县江州区扶绥县大新县宁明县龙州县 第3类龙州县东兴市靖西县田林县隆林各族自治县罗城仫佬族自治县环江毛南族自治县都安瑶族自治县象州县 武宣县忻城县天等县 第4类德保县那坡县凌云县乐业县西林县风山县东兰县巴马瑶族自治县金秀瑶族自治县 第5类右江区金城江区 第6类天峨县合山市 第7类玉州区 第8类平果县 第9类凭祥市 第1类第3类第4类柳江县鹿寨县临桂县灵Ji『县兴安县永福县荔浦县右江区田东县金城江区 三江县资源县德保县那坡县凌云县乐业县田林县西林县风山县东兰县巴马瑶族自治县金秀瑶族自治县 苍梧县藤县岑溪县钦南区钦北区浦北县玉州区容县 第2类隆林各族自治县钟山县南丹县天峨县大化瑶族自治县江州区扶绥县龙州县 第5类第6类柳城县平乐县防城区港北区兴业县田阳县昭平县象州县忻城县大新县宁明县 邕宁县合浦县灵山县北流市平果县八步区兴宾区 第7类上林县隆安县马山县融安县融水县港南区覃唐区靖西县罗城仫佬族自治县环江毛南族自治县都安瑶族 自治县武宣县天等县 第8类阳朔县灌阳县龙胜各族自治县恭城瑶族自治县蒙山县上思县东兴市福绵区富川瑶族自治县合山县凭祥市 第9类武鸣县横县宾阳县全州县平南县佳平县陆川县博白县宜州市 ②DGDSOM能够自适应地产生聚类的数目,克服了SOFM模型需要预先指定聚类数目的缺陷。 ③DGDSOM模型算法迭代了113次得到的结果(平均信任度:0.83)优于SOFM网络模型算法迭代 10 000的结果(平均信任度:0.59)。 维普资讯 http://www.cqvip.com 260 广西师范大学学报:自然科学版 第25卷 4结束语 本文提出的DGDSOM模型是在SOFM网络模型的基础上,引入节点信任度的反馈计算,通过节点 的增删策略来动态建立自组织神经网络结构,克服了SOFM网络模型需要先验知识确定网络结构并且结 构固化的缺陷。应用实例实验结果表明:DGDSOM模型算法最终产生的聚类结果数目准确并且不依赖于 先验知识;节点信任度的计算定量地评价了各个聚类的效果;模型的训练比传统的SOFM模型明显要少, 训练效率得到明显提高。 参考文献: [12 DISTANTE C,SICILLIANO P,PERSUAD K C.Dynamic cluster recognition with multiple self—organizing maps ̄J]. Pattern Analysis&Applications,2002,5(3):306—315. [22 STILL S,BIALEK W.How many clusters?An information—theoretic perspective[J].Neural Computation,2004,16 (12):2483—2506. [3]HAMMER B,MICHELI A,SPERDUTI A,et a1.Recursive self—organizing network models[J].Neural Network, 2004,17(8/9):1061—1085. 1-4]ALAHAKOON L D.Controlling the spread of dynamic self—organizing maps[J].Neural Computing 8‘Applications, 2004,13(2):168—174. [5]TINO P,FARKAS I,van MOURIK J.Dynamics and topographic organization of recursive self—organizing maps[J]. Neural Computation,2006,18(i0):2529—2567. [62王莉,王正欧.TGSOM:一种用于数据聚类的动态自组织映射神经网络[J].电子与信息学报2003,25(3):313—319. [72广西年鉴编委会.广西年鉴:2005卷[M].南宁:广西年鉴出版社,2006. Is]闻新,周露,王丹力.MATLAB神经网络应用设计[M].北京:科学出版社,2000. New Neural Network Model Based on Dynamic SOFM LU Yu—min,GUO Hui—lin,LI Tao—shen,SU Yi—dan (School of Computer,Electronics and Information,Guangxi University,Nanning 530004,China) Abstract:A neural network model based on dynamic growth and delete self—organizing maps (DGDSOM)is presented as an extended version of the Self—Organizing Feature Maps(SOFM),which needs tO preset the clustering number and tends to cluster fuzzily.This paper details the clustering algo— rithm and the implementation of the DGDSOM.The clustering node support degree is defined,and the strategy on growing and deleting nodes dynamically is formulated according to the competition result, support degree and center’S similarity,which is helpful to improve the clustering results.The actual clustering analysis shows that this algorithm can get accurate clustering results. Key words:DGDSOM;clustering;SOFM;node support degree (责任编辑 李小玲) 

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- haog.cn 版权所有

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务