您好,欢迎来到好走旅游网。
搜索
您的当前位置:首页图形工作流驱动的空间信息服务链研究

图形工作流驱动的空间信息服务链研究

来源:好走旅游网
计算机研究与发展 ISSN lOOO一1239/CN 11-1777门rP j ournal of Computer Research and Development 49(6):1357—1362,2012 图形工作流驱动的空间信息服务链研究 张建博 刘纪平。 王 蓓。 (武汉大学资源环境与科学学院 武汉430079) (中国测绘科学研究院 北京 10083O) 。(中国科学院地理科学与资源研究所北京 100101) (finecho@163.corn) Spatial Information Services Chaining Based on Graphic。Workflow Zhang Jianbo ,Liu Jiping ,and Wang Bei。 (School of Resource and Environmental Science,Wuhan University,Wuhan 430079) (Chinese Academy of Surveying and Mapping,Beijing 100830) 。(Institute of Geographic Sciences and Natural Resources Research,Chinese Academy of Sciences,Beijing 100101) Abstract Traditional workflow technology can’t meet the requierments of spatial"information services chaining aggregation because of the particularity of the long time cost of spatial data processing and the interface that workflow calls spatial information services chaining.The main problems lie in the mismatch of interface,and 1OW efficiency.Thence,the model of spatial information service chaining aggregation is established。expending the model of traditional WPS chaining whose insufficient is considered.By analyzing the main problems between the interface and spatial data processing about spatial information services during the workflow scheduling,we present corresponding methods of the interface transformation to make the workflow call spatial information services chaining well,and adopt a strategy of GML—compressed scheduling to guarantee the spatial data flow be lowly transmitted on the network.Finally,the concrete solutions of spatial information services chaining processing are presented in the paper combined Kepler workflow engine.The experimental results show that this scheduling method not only breakthroughs interface bottlenecks through the interface transformation used in the workflow before,but also improves spatial information service chain execution efficiency through the strategy transformation of spatial data flow. Key words spatial information services;services chaining;combining;GML data flow strategy; graphic—workflow;Kepler 摘要空间信息服务链由于其空间数据操作对时间的要求以及其应用于工作流对接口要求的特殊性, 使得传统的工作流很难调度空间信息服务链,主要的问题在于接口不匹配以及运行效率低下.在传统 WPS服务链的基础上,针对其不足提出了基于图形工作流的空间信息服务链聚合模型.通过分析工作 流调度空间信息服务链存在的主要问题,提出相应的接口改进方法,以及基于地址引用、压缩GML的 数据调度策略.并结合Kepler工作流引擎,给出了空间信息服务链聚合的具体过程.经过实验证明:基 于图形工作流环境,不但突破了以往空间信息服务应用于工作流的接口瓶颈,而且改进的数据流调度策 略有助于空间信息服务链执行效率的提高. 关键词空间信息服务;服务链;聚合;GML调度;图形工作流;Kepler 中图法分类号TP311 收稿日期:201卜03 17;修回日期:2012 02 06 基金项目:国家自然科学基金项目(40901195) 基于工作流技术聚合标准的空间信息服务为网 络环境下分布式空间信息的共享和互操作提供了有 效的解决方案 ].但是OWS(OGC web service)服 务链应用于工作流主要存在两个方面的问题: 1)接口层面.面向服务的工作流引擎采用 OASIS_2 标准,而空间信息服务则采用OGC(open geospatial consortium)标准,导致空间信息服务在 工作流中不能被聚合. 2)数据层面.OGC标准化的WFS(Web feature service)和WPS(Web processing service)服务以GML 为共享交换格式,密集的GML操作使得工作流执 行空间信息服务链效率较低. 目前,对基于工作流的空间信息服务链聚合研 究主要集中在2个方面:从抽象空间信息服务描述 中自动派生BPEL(工作流描述语言),送入工作流 引擎执行l_3 ],以及采用语义、本体的方法构建服务 链从而驱动工作流 ].这些方法主要是从概念层次 上讨论工作流,并没有针对空间信息服务在工作流 中如何建模作深入的探讨.因此,本文主要研究如何 改进OWS服务接口,以及服务链执行策略,使 OWS服务链无缝地应用于图形工作流. 1 OWS服务链与图形工作流 1.1空间信息服务选择 OGC标准化了多种的空间信息服务:地图服务 (WMS,wCS)、要素服务(WFS)、处理服务(WPS) 等.本文以WFS要素服务为数据源、WPS处理服务 为节点,构建OWS服务链. 1.2图形工作流 工作流引擎按照过程建模的不同可分为BPEL 过程建模工作流和图形建模工作流.基于BPEL过 程建模的工作流原理是采用BPEL语言定义服务 链,然后交给工作流引擎执行,由于缺乏可视化工具 支持,造成BPEL谱写困难. 图形建模工作流是通过手动拖拽图形代理的方 式定制服务链.相比BPEL过程建模工作流具有以 下优点:1)提供了过程建模的可视化工具,用户不需 要通过手工谱写过程建模语言;2)客户端应用程序 只需要实现WMS、WFS要素服务的可视化,执行 过程交由图形工作流执行,实现应用程序客户端、图 形工作流客户端以及工作流引擎最大程度上的松耦 合架构;3)面向服务的图元代理能够动态发现、聚合 经过接口改造的OWS服务,易于实现GML数据调 计算机研究与发展2012,49(6) 度策略. 比较典型的是美国加利福尼亚大学的Kepler 开源工作流.因此,本文选择Kepler聚合OWS服 务链. 2 图形工作流驱动OWS服务链模型 2.1传统WPS服务链模式 WPS_1 标准定义了简单的服务链.要求服务链 中参与聚合的WPS服务实例以KVP编码的方式 提交GET请求.可以描述为 Gg URL—req(req1(req 2(req (…)))), (1) 其中,req为当前WPS服务请求,req 为参与服务链 的0WS服务请求,包括WFS的GetFeature以及 其他WPS的Execute.从式(1)中可看出,WPS标 准定义的服务链以嵌套URL的方式聚合服务请 求,由于URL编码的字符,这种服务链仅仅适 合少数OWS服务的聚合,并且嵌套的服务聚合给 服务监控以及异常捕捉带来很大的困难. 2.2 图形工作流驱动OWS服务链模型描述 图形工作流引擎聚合OWS服务,不再采用 KVP编码接口.如图1所示.假设存在WFS , WFS。,WPS ,WPS。四个OWS服务.首先对其添 加WSDL描述,对消息响应采用SOAP绑定;接着 改进WFS接口,使之能够输出GML地址引用,同 时为WPS接口添加接口解析器,便于WPS非 GML数据类型的参数传递(ZIP);然后采用工作流 引擎的可视化界面构建OWS服务链流程,由图形 工作流引擎完成执行、监测、输出工作. Request Response Fig.1 The description of OWS chaining model with workflow. 图1 工作流驱动服务链概念模型描述 张建博等:图形工作流驱动的空间信息服务链研究 从图1可以看出,图形工作流引擎作为调度中 心控制每个OWS服务,其服务聚合遵循式(2): V—WDr忌Flow(OWSl,OWS 2,…,OWS ).(2) 不再以WPS为单独的服务链入口,而是将嵌 套的服务拆分为多个WFS,WPS服务.工作流中的 OWS服务通过多点服务增值的方式聚合,而不是式 (1)描述单点WPS服务聚合;语义层面的URL聚 合变为GML格式的数据体聚合. 3 图形工作流驱动OWS服务链实现 本文根据Kepler工作流以及标准空间信息服 务的特点,通过分析OWS服务链面向图形工作流 的接口以及数据调度问题,提出了图形工作流引擎 聚合oWS服务链的执行策略. 3.1 OWS服务接口封装 OWS服务与图形工作流在内部接口和外部接 口层面都存在较大的差异. 1)外部接口.①Kepler工作流面向标准web 服务.节点映射的服务以标准的WSDL描述、节点 之间以SOAP为通信协议进行互操作.但是OGC 并没有给出相关规范;②虽然OGC在OWS一5中提 出了WPS要支持WSDL,SOAP协议的需求,但是 没有明确提出支持WFS的WSDL封装,因此图形 工作流不能协调WFS,WPS的服务聚合. 针对这种外部接口层面的不一致问题,需要针 对WFS,WPS进行接口封装.以WPS为例,包含3 种接口GetCapabmties,Execute,DescribeProcess. 仅需要将Getcapabmties请求通过WSDL封装,同 时改造Execute请求,使之支持SOAP协议,如图2 所示.Kepler引擎驱动WPS服务能够从封装后的 GetCapabilities中获取Execute的sOAP请求. 2)内部接口.①虽然为WPS添加了WSDL描 述,但是WPS的输入参数类型并不在GetCapabilities 接口中描述,而是在Descr ePrOcess(WFS为 describeFeatureType)接口中定义,Kepler工作流 不能够从Getcapabi1ities接口中提取SoAP请求 所必备的参数类型;②OGC标准没有针对WPS的 输入输出参数做强制规范,可以是单独参数也可以 是复杂类型complexType的多参数输入输出,WPS 人口无法动态识别复杂类型参数. 例如图1描述的OWS服务,WPS 的输出接口 Response 可能为GML实体数据类型,也可能是包 含在GML中的URL地址引用类型.在Kepler驱 动的这个OWS服务链中,WPS 输入接口无法确认 是GML实体数据,还是URL地址引用,因为两者 的参数类型都是AnyURL这一弱类型语言.这一问 题的实质是图形Kepler工作流无法自动解析非实 体化GML数据. Fig.2 WPS with WSDL. 图2 WPSWSDL描述 解决这个问题需要在WFS,WPS服务的输出 端添加GML解析器.如图3所示:假设WPS 输出 GML,非LineString类型,而是包含遥感图片的 URL地址,那么GML解析器就为下一节点WPS 解析出正确的URL地址及其类型,而不是GML数 据体.需要指出的是,OWS服务链构建者不需要另 行编码设计,Kepler提供了XML解析组件,用户需 要利用这种组件提取所需的参数以及类型. _-_-—- URLL悃J Fig.3 WPS output interface define. 图3 wPS输出接El解析器 3.2 图形工作流调度OWS服务链策略 标准OWS服务链以GML为共享数据交换格 式,密集的GML输入输出给工作流驱动OWS服务 链带来效率上的问题,需要额外的网络传输时间开 销,而且网络传输大数据量的GML速度慢. 图4表达了数据调度的两种策略.细实线为 Kepler代理的服务请求,虚线和粗实线表示数据传 输的2种方式,数据请求、传输由各个图元节点控制. 传统的数据调度方法如虚线所示,所有的OWS 服务都返回GML数据,是一种高密度GML调度模 张建博等:图形工作流驱动的空间信息服务链研究 WFS以及WPS的GetCapabmties接口作为Kepler 节点映射服务的URL地址,如:http.//ServerUrl? wsd1.②改造WFS的输出接口,输出的GML文件不 再表达矢量对象,而是包含AnyURL类型的URL地 址引用.实质上是将WFS逻辑对象转换成地址引用, 减少GML操作.③为WPS接I21添加接VI解析器,解 析WFS的输出文件中包含的GetFeature请求返回的 URL引用地址.然后交给下一节点的WPS执行. 2)服务发现.Kepler引擎提供Web服务搜索 工具一——图元代理Actor,可通过拖拽的方式将参 与OWS服务的Actor代理工具置于工作流,actor 代理按照WSDL描述自动发送SOAP协议,并捕获 输出以及异常. 3)服务聚合.①配置图元代理Actor1,Actor2, 以发现WFS1,WFS2要素服务,发送GetFeature请 求(SOAP协议),返回GML。,GML2,但包含的是 GML数据的URL地址引用;②将GML通过解析 器解析出要素地址引用;③图元代理Actor。接收 URL引用,并发送Execute请求,内部调用WFS的 GetFeature请求,获取参与求交运算的GML数据; 然后通过矢量求交运算处理,获取求交后的多边形 混合数据GML ;最后交由面状要素化简处理服务 化简数据,得到GML ,交由客户端验证显示. 4实验与分析 实验展示了Kelper工作流聚合OWS服务链 的效果,并对聚合策略进行了性能测试,将采用地址 引用、压缩GML的策略和密集GML操作的策略作 了比较分析. 4.1实验数据与环境 首先提出参与实验的OWS服务链实例:获取 全国某机构办事处的点状要素,与所在省份的多边 形要素求交,经过Douglas—Pcucker化简算法多边 形,返回客户端显示.涉及的空间信息服务均为 OGC标准的空间信息服务,具体如下: 1)中国省级行政区划要素服务(WFS ); 2)某机构办事处的点状要素服务(WFS。); 3)要素求交服务(WPS ); 4)要素化简服务(WPS。). 在实验中,参与聚合的要素服务(WFS)采用 Geoserver(开源地图服务引擎)发布,处理服务 (WPS)由开源软件52。North的空间信息处理组件 1361 发布.聚合生成的GML数据由客户端Openlayers 展示.采用Kepler图形工作流引擎聚合OWS服务. 4.2结果与分析 实际的工作流执行过程如图5所示.图6为聚 合的最终结果.图6(a)(b)(c)分别为Openlayers客 户端展示的原子级别的服务,图6(d)为Kepler工 作流调用WPS(douglas—pcucker化简算法)化简多 边形,输出GML的最终展示结果. (d)WPS2 Fig.6 OWS services. 图6 OWS服务 为了验证地址引用、压缩GML策略和密集 GML策略针对不同的GML数据量的执行效果,提 供3种比例尺的省级行政区划数据:1:4000000, 1:1000000和1:250000矢量数据(主要是对行政区 划进行化简).由Geoserver发布后的GML数据量 分别为1.47 MB,11.2 MB和23.5 MB.表1、表2分 别为不同策略在不同数据量环境下的时间费用.实 验结果表明,当GML数据量较小时,优化的调度策 略的时间优势不明显;但是当服务链处理的GML 数据量越大时,对聚合调度的优化效果越明显. Table 1 Time Cost of Strategies with Lar ̄r GML 表1密集GML调度策略时间消耗 S Table 2 Time Cost of Optimizing Strategies 表2优化的调度策略时间消耗 l362 整个服务链聚合执行的时间费用可以分为3个 部分:①WFS 产生的GML传输费用;②WPS 解 析、处理GML费用;③WPSz解析、处理GML费用. 其中,空间处理算法依赖于服务端算法的性能优略, 两种策略使用相同的WPS处理算法,在该部分所 耗费的时间没有差异.因此,整体的性能取决于 GML的传输以及对GML的序列化和解析的能力. 如果传输的GML数据量小,网路传输和解析 GML的费用没有太大的区别.然而当数据量大时, 网络传输GML的费用成倍增加,对比式(6)和式 (10)可以发现,采用地址引用、压缩GML的策略首 先避免了GML下载到本地造成的时间消耗,同时 采用压缩GML的方式降低了网络传输费用,整体 时间消耗接近密集GML策略的一半. 5 结 论 本文利用图形工作流为聚合标准OWS服务提 供了新的解决方案,并且通过实验证明了这种方案 不仅突破了()wS服务应用于工作流的接口瓶颈, 而且通过改进的数据流调度策略提高了OWS服务 链的执行效率. 参 考 文 献 [1] Alameh N.Chaining geographic information Web services [J].IEEE Internet Computing,2003,7(5):22—29 [2] Nickull D.Reference model for service oriented architecture, version 2.2[s].Billerica:Organization for the Advancement of Structured Information Standards(OASIS),2006 [3] Jia Wenyu,Li Bin,Gong Jianya.Research on dynamic GIS chain based on workflow technology[J].Geomatics and Information Science of Wuhan University,2005,30(1 1): 982—985(in Chinese) (贾文珏,李斌,龚健雅.基于工作流技术的动态GIS服务 链研究[J].武汉大学学报:信息科学版,2005,30(11): 982-985) [4] Granell C,Gould M,Ramos F.Service composition for SDIs:Integrated components creation[C]//Proc of the 2nd Int Workshop on Geographic Information Management (GIM’05).Piscataway,NJ:IEEE,2005:475—479 [5] Kiehle C, Greve K,Heier C. Standardized ge0pr0cessing— taking spatial data infrastructures one step further EC]//Proc 计算机研究与发展2012,49(6) of the 9th AGILE Int Conf on Geographic Information Science.Piscataway,NJ:IEEE,2006:239—251 [6] Kiehle C,Greve K,Heier C. Requirements for next generation spatial data infrastructures—standardized Web based geoprocessing and Web service orchestration[J]. Transactions in GIS,2007,11(6):819-834 [7] Granell C,Lemmens R,Gould M,et a1. Integrating semantic and syntactic descriptions tO chain geographic services_J].IEEE Internet Computing,2006,10(5):42—52 Es] Friis—Christensen A,Ostlander N,Lutz M,et a1.Designing service architectures for distributed geoprOcessing:Challenges and future directions[J].Transactions in GIS,2007,11 (6):799—818 E9] Hu Naijing,Gu Ning,Shi Baile.Correctness of concur-rency based on semantic constraint resource workflow[J].Journal of Computer Research and Development,2003,40(5):712— 719(in Chinese) (胡乃静,顾宁,施伯乐.基于语义约束资源工作流并发正确 性保证[J].计算机研究与发展,2003,40(5):712—719) [1O] Lud/ischer B,Ahintas I,Berkley C,et a1.Scientific workflow management and the kepler system口]. Concurrency and Computation:Practice and Experience, 2006,18(10):1O39—1065 [11] Schut P.OpenGIS Web Processing Service[M/OL].Open Geospatial Consortium Inc(OGC),2007.[2007—06—08]. http://www.openge0spatia1.org regional planning(wangb.09b@igsnrr.ae.cn). 

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- haog.cn 版权所有 赣ICP备2024042798号-2

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务