您好,欢迎来到好走旅游网。
搜索
您的当前位置:首页基于小波包变换的三维荧光光谱数据压缩方法

基于小波包变换的三维荧光光谱数据压缩方法

来源:好走旅游网
第4O卷第6期 2013钲 北京化工大学学报(自然科学版) Journal of Beijing University of Chemical Technology(Natural Science) Vo1.40.No.6 2013 基于小波包变换的三维荧光光谱数据压缩方法 岳著风王颖‘ (北京化工大学信息科学与技术学院,北京 100029) 摘 要:基于db小波包变换,采用频率分级阈值方法对三维荧光光谱数据进行了压缩。建立了数据的小波包分解 树,根据对数能量熵最小原则确定最优树,通过频率分级阈值方法对最优树中的小波包系数进行压缩,并且用实验 获取的数据加以验证。实验结果表明,和小波变换相比小波包变换能够更有效地保留数据的细节信息。通过和其 他阈值法比较可知,频率分级阈值法具有更好的压缩率和数据恢复能力,其压缩分数达到90%,恢复分数大于 98%,谱线相对误差小于1%。平行因子分析重构光谱与原始光谱的结果表明,小波包压缩能有效保留有用信息。 关键词:数据压缩;三维荧光光谱;小波包变换;平行因子法 中图分类号:0644.1 引 言 荧光光谱分析法由于具有测量简便、灵敏度高、 检测限低等优点,目前已被广泛应用于各种具有荧 光特性的物质,尤其是芳烃类化合物的定性和定量 分析上…。三维荧光光谱技术能够同时记录物质 在不同激发波长与发射波长时的荧光强度变化,获 得完整的荧光光谱信息 。但与二维荧光光谱相 域和频域的分辨率。小波变换的局部分辨能力较 高、压缩率较大,目前被用于红外光谱数据压缩,并 取得了较好的数据压缩效果。相较小波变换,小波 包变换能同时对数据的低频和高频分量分别进行小 波变换,得到低频概要和高频细节信息。 三维荧光光谱数据包含较多表征物质结构的细 节信息,选取小波包变换进行三维荧光光谱数据压 缩可以在充分获取高低频局部信息的基础上,保留 高频细节信息 的同时剔除冗余信息。小波包变 比,三维荧光光谱存在数据量大及信息冗余 等问 题,增加了数据处理的难度和存储量 。因此基于 三维荧光光谱数据进行数据压缩。在保证三维荧光 光谱所含物质光谱强度信息不丢失的前提下,有效 换阈值的选择对于保留三维荧光光谱数据的信息非 常重要,传统的阈值选取方法不能同时获得较好的 压缩和恢复效果,因此本文针对三维荧光光谱进行 小波包变换,采用频率分级阈值法进行数据压缩,并 对压缩效果进行比较分析。 剔除冗余信息是三维荧光光谱数据处理的关键。 光谱数据的压缩方法主要有主成份分析法 、 傅里叶变换法 、小波变换" 和小波包变换n。 3] 等。其中主成份分析法通过将数据投影到能量分布 较高且相互正交的新坐标轴实现数据压缩。但光谱 l 小波包压缩原理及评价函数 1.1小波包变换 令正交小波基的滤波器系数分别为离散序列 h ,g ,尺度函数 ( )记为/3,。(t),小波函数 ( )记 图像数据经主成份变换后会丢失一些对方差和峰值 信噪比影响小的细节信息,且缺乏、分解的灵活性。 傅里叶变换法是将原始数据经傅里叶变换得到频域 为“ ( ),于是小波包函数的二尺度方程变为 { 系数来实现数据压缩,但傅里叶变换法缺乏时间一 频率的定位能力、无法根据数据特点自适应调节时 收稿日期:2012—12—26 fu0( )= ∑ u。(2t一尼) (1) 【u。(£)= ∑gku0(2t一 ) 空间 可以分解为正交空间【, 和 uj…2n+。,因此小 波包函数可表示为 2 基金项目:国家自然科学基金(50975019) 第一作者:女,1988年生,硕士生 通讯联系人 E—mail:wangying@mai ̄t.buct.edu.ca f啦m(f)=∑hi-2 n, (¨ 2n +l /+,(2)  ̄X,:、E g .2 ujn,l(t) 第6期 岳著风等:基于小波包变换的三维荧光光谱数据压缩方法 小波包函数“mrt(f)=2 H (2~t一 )是中心 在2Jk,支集大小数量级为2 ,振荡次数为n的小波 包函数,k为时间位移。对离散序列,进行小波包分 解得到其在子空间 公式为 系数大多不为零;高频段小波包系数值较小,但包含 剧烈变化的细节信息,小波包系数大多为零。因此 采用将频率分成低、中、高3个频段分别确定阈值的 中的小波包系数 (k),计算 方法进行三维荧光光谱数据压缩,可以有效保留细 节信息。 厂=∑aT(k) (£) 进一步小波包系数递推公式为 (3) 第4步用被保留的小波包系数进行三维荧光 光谱数据的重构。 1.3 基于频率分级的阈值确定方法 f 。( ):∑h2k- ̄ (f1 {【  ( )=∑ (z) 基于小波包分解系数可实现离散序列的重构 根据三维荧光光谱小波包系数能量在不同频段 (4) 的差异,将最优树中小波包系数分为低频、中频和高 频3段,针对不同频段确定不同的阈值,具体方法如 下。 (.j})=∑hk-21 : ( )+∑gk ̄21 : ‘(|j})(5) 1.2基于小波包变换的三维荧光光谱数据压缩 1)小波包分解后的频率范围为0-L,选取频率 在0 ̄f,/10范围内的为低频段,选取频率在L/lo一 7f./10范围内的为中频段,选取频率在7L/10~ 范 围内的为高频段。 基于小波包变换的三维荧光光谱数据压缩包括 小波包分解,最优树选取以及小波包系数阈值量化 等步骤。具体压缩过程如下。 第1步对原始三维荧光光谱数据进行小波包 分解。由于db小波函数具有很好的正交性和紧支 撑性、小波包滤波器系数少、计算量少等优点,选取 2)计算最优树小波包系数在各频段内的能量 占总能量的分数P ,P ,P 。若低、中、高频段内某 个结点处对应的小波包系数的个数分别为Ⅳ..,J7v , ⅣH。将各结点小波包系数按由大到小排序,分别计 db小波函数生成的小波包进行三维荧光光谱数据 的分解,在小波包空间 dl‘={d (k)}。 得到对应的小波包系数 算P ×NL,JPM xNM和PH×Nn并取整作为低、中、高 频段内该节点处的阈值,如果对应频段内该结点处 小波包系数的序数小于等于该频段阈值,小波包系 第2步基于信号代价函数最小原则确定最优 数保留,如果小波包系数的序数大于该阈值则小波 包系数置零。 1.4小波包压缩的评价函数 树。选取对数能量熵作为信号代价函数,对数能量 熵的计算公式为 ( )=∑IT n((d (|。 i})) ) (6) 为评价基于小波包变换的数据压缩效果,采用 压缩分数 、恢复分数卢和谱线相对误差6进行评 价。压缩分数 用于表征数据压缩量的大小,其计 算公式为 =100(N。/Ⅳ2) (7) 采用“自底向顶”逐层比较的方法确定最优树, 设最底层的小波包系数为子结点,其上层系数为父 结点。当所有子结点的对数能量熵之和小于其对应 父结点的对数能量熵时,保留所有子结点,否则剔除 式(7)中Ⅳ 为小波包压缩阈值量化过程中被置零的 小波包系数的数量,Ⅳ:为原始数据小波包系数的总 所有子结点,原父节点变为子结点。重复上述步骤 直到最顶层,所有被保留的结点组成最优树。 第3步对小波包系数进行量化,确定合适的 数。压缩分数越大,表明数据压缩量越大。恢复分 数口表征压缩数据相对于原始数据的失真程度,计 算式为 阈值将所含信息较少的小波包系数置零实现数据压 缩。全局阈值量化通过估计信号噪声设定阈值,没 有考虑小波域不同尺度上的噪声差别;分层阈值量 化对不同尺度进行噪声估计设定多个阈值,得到了 比全局阈值量化更好的压缩效果,但损失很多细节 信息。通过分析比较发现三维荧光光谱数据小波包 系数在低频段的数值较大且数值接近,含有大部分 卢=100(1I C:II/Il C。0) (8) 式(8)中ll C。II和II C 0分别为量化前后小波包系 数的范数。恢复分数越大,表明压缩数据的信息失 真越小。谱线相对误差表征压缩数据与原始数据之 间的偏差,其计算公式为 6=100(1I :一 。0/lI l I1) (9) 有用信息;中频段包含缓慢变化的纹理信息,小波包 式(9)中, 为光谱原始数据,X 为光谱重构数据。 北京化工大学学报(自然科学版) 谱线相对误差越小,表明压缩数据与原始数据的差 别越小。 1.5 三维荧光光谱数据的平行因子分析 平行因子分析(PARAFAC)是基于三线性分解 理论,采用交替最小二乘算法实现多组分物质分解 和识别的数学模型。将平行因子分析用于混合物三 维荧光光谱数据分析, 为不同发射波长和激发波 长下的混合物三维荧光光谱强度矩阵。 可分解为 纯组分的激发光谱矩阵A、发射光谱矩阵 和混合 物中各组分的浓度得分矩阵c,其分解模型为 F f,6 +eljk (10) ,=1 式(10)中 诚为第 个样品在激发波长i、发射波长 处的荧光强度值,i:1,…,j,-『=1,…,J,k=1, …,K;j,.,分别对应激发和发射波长的数量,K为被 测样品总数;F代表混合物中纯组分的组分数,也称 因子数,e; 为残差,口 6『,、c 分别为矩阵A、B、C中 的元素,分别代表激发光谱强度、发射光谱强度和浓 度信息。用平行因子分析混合物三维荧光光谱可得 到混合物中所包含的纯组分种类和浓度信息。采用 平行因子分析分别对原始和压缩后的混合物三维荧 光光谱数据进行分析,对比分析结果对小波包压缩 三维荧光光谱数据效果进行评价。 2 三维荧光光谱数据的压缩 2.1 三维荧光光谱数据的获取 实验采用日立F-7000型荧光光谱仪,对不同质 量浓度的萘、1一萘酚和2一萘酚混合物样品进行了三 维荧光光谱检测。实验选用分析纯萘、1一萘酚和2・ 萘酚试剂,1.萘酚、2.萘酚分别用0.1 mol/L KOH水 溶液配成质量浓度为1 g/L的储备液,萘用无水乙 醇配成1 g/L的储备液,避光保存。利用储备液配 制了9个不同质量浓度的萘、1.萘酚、2一萘酚混合物 样品,进行三维荧光光谱检测。为增强混合物的互 溶性,减少特征光谱的重叠,向每个混合液样品中加 入等量的KOH溶液和无水乙醇。实验中荧光激发 波长范围220—300 nm,波长间隔2 nnl;发射波长范 围325—600nm,间隔5 nm,扫描速度1200nm/min。 2.2数据压缩结果 考虑到小波包变换的局部化能力和计算量,经 多次计算比较最终选择消失矩为3的db小波包函 数对9组混合物样品的三维荧光光谱数据进行压 缩。图1为基于能量熵的最优树。 (0'0】 (2,O)(2,1)(2,2)(2,3) 【3,52)(3,53)(3,54)(3,55)(3,56)(3,57)(3,58)(3,59) 图1样本1的最优小波包树 Fig.1 Best—tree of the first sample 根据最优树分解方案,采用频率分级方法得到 表1。根据结点所在的频段将其划分到低中高频。 频率在0~ /10范围内的结点划归低频段,频率在 L/10—7f./10范围内的结点划归中频段,频率在 / l0~7f/lo范围内的结点划归高频段。根据各结点 所在频段的能量分数与该节点处小波包系数确定保 留下来的小波包系数个数。 表1样本I的频率阚值压缩结果 Table l Results for the first sample 为验证压缩效果,分别进行了基于小波变换和 小波包变换的全局阈值数据压缩。从压缩结果看, 虽然小波包变换压缩分数和小波变换压缩分数接 近,但小波包变换的恢复分数远高于小波变换,表明 小波包变换的细节信息恢复能力优于小波变换。针 对小波包变换,选取了3种不同的阈值方法进行压 缩,三维荧光光谱数据压缩结果如表2所示。从表 2可看出分层阈值比全局阈值具有较高的压缩分数 和较低的谱线相对误差。基于小波包变换的频率分 级阈值的压缩分数接近9o%,恢复分数达到98%以 上,谱线相对误差小于1%。比其他两种阈值方法 高出l8%左右,且细节信息的恢复也明显优于其他 两种压缩方法。 ・104・ jE京化工大学学报(自然科学版) 2013正 三维荧光光谱数据与压缩后数据PARAFAC分析得 到的3种物质的发射光谱曲线,图3(b)比较了基 于原始三维荧光光谱数据与压缩后数据PARAFAC 分析得到的3种物质的激发光谱曲线,实线为压缩 后数据的分析结果,虚线为原始数据的分析结果;横 坐标分别为发射和激发光谱的波长,纵坐标为相对 荧光强度。从图3可以看出数据压缩前后3种物质 的激发和发射光谱曲线几乎重合,表明频率分级压 缩后的数据基本保留了原始三维荧光光谱数据的全 部有用信息。 3 结论 采用小波包变换对工业污水中优先监测物质 萘、1 萘酚和2.萘酚混合溶液的三维荧光光谱数据 进行压缩处理。该方法有效压缩分数明显高于其他 阈值压缩方法,压缩分数接近90%,恢复分数达到 98%以上,谱线相对误差小于1%,并且小波包压缩 保留了三维荧光光谱数据的全部有用信息。小波包 变换用于三维荧光光谱数据压缩可以取得很好的数 据压缩效果,具有很好的实际应用价值。 参考文献: [1] 陈茂福,吴静,律严励,等.城市污水的三维荧光指 纹特征[J].光学学报,2008,28(3):578-581. Chen M F,Wu J,Lu Y L,et a1.Fluorescence properties of municipal wastewater[J].Acta Optics Sinica,2008, 28(3):578—581.(in Chinese) [2]Henderson R K,Baker A,Murphy K R,et a1.Fluores— cence as a potential monitoring tool for recycle water sys— tenrs:A review[J].Water Research,2009,43:863— 881.(in Chinese) [3] 梁逸曾,易伦朝.化学计量学基础[M].上海:华东 理工大学出版社,2010. Liang Y Z,Yi L C.Chemometrics basis[M].Shanghai: East China University of Science and Technology Press, 2010.(in Chinese) [4] Kaarna A,Zemeik P,KalviAinen H,et a1.Compression of multispeetral remote sensing images using clustering and spectral reduction[J].IEEE Transactions on Geosci— ence and Remote Sensing,2000,38(2):1588-1592. [5]蒋梅城,陆继东,姚顺春,等.小波变换在激光诱导 击穿光谱压缩中的应用[J].光谱学与光谱分析, 20l0,30(1o):2797-2801. Jiang M C,Lu J D,Yao S C,et a1.Application ofwave- let transfo珊in laser-induced breakdown spectra compres— sion[J].Spectroscopy and Spectral Analysis,2010,30 (1O):2797-2801.(in Chinese) [6] 陈宗海,邵学广,林祥钦.傅里叶变换一主成份分析 方法用于二维色谱数据的压缩和重构[J].分析实验 室,2000,19(6):46-49. Chen Z H,Shao X G,Lin X Q.Compression and recon— struction of two・-way chromatograms by FT・-PCA technique [J].Chinese Journal of Analysis Laboratory,2000,19 (6):46-49.(in Chinese) [7] 田高友,袁洪福,刘慧颖,等.小波变换用于近红外 光谱数据压缩[J].分析测试学报,2005,24(1):17~ 2O. Tian G Y,Yuan H F,Liu H Y,et a1.Application of wavelet transform to compression near infrared spectra da- ta[J].Journal of Instrumental Analysis,2005,24(1): l7—20.f in Chinese) [8] 赵艳粉,杨洪耕.二维离散小波变换在电能质量检测 数据压缩中的应用[J].电力系统自动化,2006,30 (15):51—55. Zhao Y F.Yang H G.Data compression method using 2- dimensional discrete wavelet transform for power quality detection[J].Automation of Electric Power Systems, 2006,30(15):51—55.(in Chinese) [9]许哲,张伯珩,边川平,等.基于小波的图像压缩处 理[j].科学技术与工程,2007,7(7):1462-1464. Xu Z,Zhang B Y,Bian C P,et a1.Image compression processing based on wavelet[J].Science Technology and Engineering,2007,7(7):1462-1464.(in Chinese) [10]冯登超,乔晓军,杜小鸿,等.基于最优基小波包的 植物病害图像压缩算法[J].沈阳农业大学学报, 2006,37(3):274-277. Feng D C,Qiao x J,Du x H,et a1.Compression algo・ rithm for plant disease image based on best basis of wave・ let packets[J].Journal of Shenyang Agricuhural Univer— sity,2006,37(3):274-277.(in Chinese) [11]李建坡,唐宁,朱绪宁。基于频率分级的指纹图像压 缩算法[J].光电工程,2012,39(3):106-112. Li J P,Tang N,Zhu X N.Fingerprint image compression algorithm based on graded frequency[J].Opto-Electronic Engineering,2012,39(3):106—112.(in Chinese) [12]张翠芳,朱莉娟.基于小波包最优基的语音信号压缩 方法[j].数据采集与处理,2010,25(6):746—750. Zhang C F。Zhu L J.Speech signal compression method based on wavelet packet beat—basis【J].Journal of Data Acquisition&Processing,2010,25(6):746—750.(in Chinese) [13]李如玮,鲍长春,窦慧晶.基于双正交小波包分解的 第6期 岳著风等:基于小波包变换的三维荧光光谱数据压缩方法 ・105・ 自适应阈值语音增强[J].仪器仪表学报,2008,29 adaptive threshold based on bi-orthogonal wavelet packet (10):2135—2140. decomposition[J].Chinese Journal of Scientific Instru. Li R W,Bao C C。Dou H J.¥peedh enhancement using ment,20o8,29(10):2135-2140.(in Chinese) Study of excitation—emission-matrix(EEMs)compression YUE ZhuFeng WANG Ying (College of Information Science and Technology,Bering UniVersity of Chemical Technology,Bering 100029,China) Abstract:Excitation—emission—matrix (EEMs)data have been compressed with a frequency grade thresh0ld based on a Daubechies(db)wavelet packet transform. First,the tree of the wavelet packet was f0瑚u1ated:sec. ondly,the best_tree was determined by the princip!e of minima;:ifnally,the frequency grade thresh0ld was used t0 compress the wavelet packet coefficient. Experimental data were used to test the compression abilitv 0f this meth0d. The compression res ults indicated that wavelet packet compression could retain more inf0mati0n than wavelet c0m. pression.The frequency grade threshold method based on wavelet packets was adopted t0 compress EEMs.The fre. quency grade threshold method afforded higher reconstruction percentages and compression percentages than other threshold compression methods:the maximum reconstruction percentage reached 90%,and the compres8ion per. centage was larger than 98%,with errors between spectra of lower than 1%. With the use of Dara11e1 fact0r analysis (PARAFAC)of the original EEMs data and the compressed data,it.was possible to 0btain the charaeteristics 0f the excitation and emission spectra of each component.The results of PARAFAC show that wave1et Dacket transf0l瑚 can compress and recover the information in EEMs data effectively. Key words:compression;fluorescence analysis;wavelet packet;parallel factor analysis 

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- haog.cn 版权所有

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务