2018, 29(11):3239-3240. DOI: 10.13328/j.cnki.jos.005484
摘要:业务过程管理(business process management,简称BPM)致力创新企业业务过程管理、分析、控制与改进的系统化与结构化方法,其目标在于改进产品质量、提升服务水平,是现代信息系统的共性基础技术.当今全球产业结构正呈现由“工业型经济”向“服务型经济”加速转型.智能制造是实施《中国制造2025》的主攻方向之一,是落实工业化和信息化深度融合、打造制造强国的战略举措,更是我国制造业紧跟世界发展趋势、实现转型升级的关键所在.如何针对智能制造的发展需求,研究更高效、柔性、智能的业务过程管理与服务技术面临巨大的机遇与挑战. 专题公开征文,共征得投稿31篇.这31篇论文通过特约编辑形式审查,有29篇论文进入到评审阶段.特约编辑先后邀请了30余位业务过程管理、服务计算、软件工程、智能制造等相关领域的专家参与审稿工作,每篇投稿邀请2位专家进行评审.稿件评审历经5个月,经初审、复审、第7届中国业务过程管理大会(CBPM 2017)会议宣读和终审4个阶段,最终有10篇论文入选本专题.这10篇论文主要涉及模型管理、过程挖掘、调度方法、服务技术等研究方向,其中模型管理2篇、过程挖掘2篇、调度方法3篇、服务技术3篇.
2018, 29(11):3241-3259. DOI: 10.13328/j.cnki.jos.005480
摘要:在由多个行业云服务平台组成的集成服务平台中,随着行业云服务平台加盟数及各平台下租户数量的不断增多,其底层的云工作流模型库的规模也必将不断增大.当云工作流模型库的规模超大时,需要一种效率更高的并行检索方法去满足云工作流模型库高效检索的需求.鉴于此,采用均匀划分法或自动聚类法对大规模云工作流模型库进行合理的子集划分,并结合前期工作中已改进的基于图结构的流程检索算法,提出了基于数据集分割的大规模云工作流模型库并行检索方法.该方法主要包括4种流程并行检索算法:基于均匀划分模型集的静态并行检索算法、基于均匀划分模型集的动态并行检索算法、基于自动聚类模型集的静态并行检索算法和基于自动聚类模型集的动态并行检索算法.最后,在模拟生成的大规模流程集及真实的云工作流模型库中对这4种并行检索算法的检索效率进行了实验评估.
2018, 29(11):3260-3277. DOI: 10.13328/j.cnki.jos.005476
摘要:工作流修正是工作流重用的重要任务.目前,在基于工作流的可重用片段——stream的语义工作流修正中,当工作流stream库中不存在与检索语义工作流中的工作流stream结构相似的stream时,无法修正检索语义工作流.针对这种情况,提出了一种改进方法——基于stream行为特征的语义工作流修正算法.使用任务紧邻关系集表达stream的行为特征.对于检索语义工作流的每个stream(称为查询stream),使用锚集合数据索引和stream匹配规则过滤工作流stream库得到候选匹配stream集;之后,基于变更请求和stream的行为相似性对候选stream集进行验证,得到需替换的查询stream和最符合变更请求并与它足够行为相似的匹配stream;然后,使用每个匹配stream替换对应需替换的查询stream以逐步修正检索语义工作流中的缺陷;最后得到修正语义工作流.实验结果表明,与现有的基于工作流stream的修正算法相比,该算法得到了整体质量更好的修正语义工作流集,其适应性更好.该修正算法能够为业务过程管理人员进行适应新业务需求的工作流变更提供较好质量的参考语义工作流,对提高业务过程管理中工作流重用的效率和质量有较大的帮助.
2018, 29(11):3278-3294. DOI: 10.13328/j.cnki.jos.005478
摘要:现有的过程挖掘算法依赖于"aba"模式来挖掘2度循环,而满足局部完备性的日志文件中不一定出现该模式.为此,扩展了经典Alpha算法,提出了αL+算法,用于从没有"aba"模式的日志文件中挖掘出2度循环.首先建立任务间的次序向量矩阵,用于抽象2度循环结构的变体结构;然后从全局视角,根据事件的出现次数及位置来区分2度循环和并发关系;最后提出紧邻度和回路抽象,以排除并发分支上同类型循环带来的干扰.实验结果表明,与现有的挖掘算法相比,αL+算法能够从具有"aba"模式或不具有"aba"模式的日志文件中挖掘出2度循环.此外,该算法实现且集成在开源框架ProM中.
2018, 29(11):3295-3305. DOI: 10.13328/j.cnki.jos.005481
摘要:在健康领域,诊疗过程对于医疗质量至关重要.临床路径集合了各种医疗知识,是对诊疗过程进行标准化的重要途径.然而,当前大多数临床路径由专家研讨制定,往往静态不变,难以部署和实施.在之前的工作中,提出了一种基于主题的临床路径挖掘算法,可以从医疗数据中抽取历史执行路径,客观反映数据中实际存在的医疗模式.算法首先通过主题模型将繁杂的诊疗活动聚合成若干主题,而每个诊疗日就可以表示为一个主题分布,一个病人的诊疗日志也相应的转换为一个主题序列,然后利用过程挖掘方法从这些主题序列中生成基于主题的临床路径模型.但传统主题模型(LDA)的聚类效果往往难以满足医疗数据的特点,导致主题质量不高,影响最终过程模型的可解释性.其中,一个普遍的问题就是LDA无法保证两个相似的诊疗日所得的主题分布也是相似的,这是由于其忽略了诊疗日之间原有的相似性特征.提出了一种优化的主题模型算法,该算法引入了基于本体生成的诊疗日相似性约束,可以有效地提升聚类效果.实验结果表明,提出的方法能够发现更符合医疗领域特点的高质量主题,进而为基于主题的临床路径的挖掘奠定基础.
周业茂 , 李忠金 , 葛季栋 , 李传艺 , 周筱羽 , 骆斌
2018, 29(11):3306-3325. DOI: 10.13328/j.cnki.jos.005479
摘要:云计算和移动互联网的不断融合,促进了移动云计算的产生与发展.在移动云计算环境下,用户可将工作流的任务迁移到云端执行,这样不但能够提升移动设备的计算能力,而且可以减少电池能源消耗.但是不合理的任务迁移会引起大量的数据传输,这不仅损害工作流的服务质量,而且会增加移动设备的能耗.基于此,提出了基于延时传输机制的多目标工作流调度算法MOWS-DTM.该算法基于遗传算法,结合工作流的调度过程,在编码策略中考虑了工作流任务的调度位置和执行排序.由于在用户不断移动的过程中,移动设备的无线网络信号也在不断变化,当传输一定大小的数据时,网络信号越强则需要的时间越少,从而移动设备的能耗也越少.而且工作流结构中存在许多非关键任务,延长非关键任务的执行时间并不会对工作流的完工时间造成影响.因此,在工作流调度过程中融入了延时传输机制DTM,该机制能够同时有效地优化移动设备的能耗和工作流的完工时间.仿真结果表明,相对于MOHEFT算法和RANDOM算法,MOWS-DTM算法在多目标性能上更优.
2018, 29(11):3326-3339. DOI: 10.13328/j.cnki.jos.005477
摘要:针对现有云环境下的多科学工作流调度算法中存在的未考虑安全调度问题,提出了多科学工作流安全-时间约束费用优化算法MSW-SDCOA(multi-scientific workflows security-deadline constraint cost optimizationalgorithm).首先,MSW-SDCOA基于数据依赖关系压缩科学工作流,减少任务节点数从而节省了调度开销;并通过改进HEFT(heterogeneous earliest-finish-time)算法形成调度序列,以实现全局多目标优化调度;最后,通过优化ACO(antcolony optimization)中信息素更新策略和启发式信息,进一步改善费用优化效果.仿真实验表明,MSW-SDCOA算法在费用优化效果上比MW-DBS算法提高了约14%.
2018, 29(11):3340-3354. DOI: 10.13328/j.cnki.jos.005483
摘要:一个业务流程的执行,一般需要由多个员工共同协作完成.当员工完成流程中某项任务的能力已知时,员工之间的协作能力对于整个流程的执行性能就会有决定性的影响.通常,流程中执行活动的员工之间的协作能力越高,整个流程实例的运行效率就会越高.提出了一种基于协作模式的最优员工分配方法.该方法首先通过分析历史流程日志,计算不同员工在执行不同活动时彼此之间的协作能力;然后,从历史日志中挖掘出协作较好的员工分配方式(即协作水平较高的协作模式);最后使用编码的方式将这些模式与待分配流程快速匹配,选出可使流程协作水平达到最优的员工分配方式.实验结果说明,该方法能够快速、有效地实现流程协作最优的员工分配.
2018, 29(11):3355-3373. DOI: 10.13328/j.cnki.jos.005475
摘要:云制造(cloud manufacturing,简称CMfg)模式下,制造任务和制造服务都处于动态变化的环境中,制造服务组合的动态适应能力问题亟待解决.针对这一问题,以制造任务和制造服务的匹配关系为基础,构建了制造任务-制造服务动态匹配网络(dynamic matching network,简称DMN)理论模型,在此基础上提出了一种三阶段的制造服务组合自适应方法(three-phase manufacturing service composition self-adaptive approach,简称TPMSCSAA).第1阶段通过负载队列模型对QoS进行动态评估,以负载和动态QoS为优化目标,将最优制造服务组合问题转化为制造服务网络中最短路径的搜索,实现制造服务的动态调度;第2阶段对不同类型的制造任务和制造服务变更进行实时获取,同步更新制造任务网络和制造服务网络;第3阶段触发动态调度算法,完成动态匹配边的重构.最后,通过对电梯设计服务组合的实验仿真,验证了方法的可行性和有效性.
2018, 29(11):3374-3387. DOI: 10.13328/j.cnki.jos.005482
摘要:如何根据用户的自然语言需求描述自动生成或推荐用于解决问题的Web API服务集合,并辅助构建Mashup,是业务流程管理者和服务组合者关注的热点之一.如何提高推荐的质量,是大家关注的焦点.为此,提出了一种融合多维信息的主题自适应Web API推荐方法HDP-FM(hierarchical Dirichlet processes-factorization machines)为Mashup的创建推荐Web APIs集合.该方法以Web API的描述文档为语料库,利用HDP模型训练每个Web API的主题分布向量;其次,利用已生成的主题模型预测每个Mashup的主题分布向量,用于相似度的计算;最后,将Mashup之间的相似度、WebAPI之间的相似度、Web API的流行度和共现性作为因子分解机模型的输入,评分排序获取用于推荐的Web APIs集合.为了验证HDP-FM方法的性能,使用从ProgrammableWeb平台上爬取的真实数据进行多组实验,实验结果表明,HDP-FM方法在准确率、召回率、F-measure和NDCG@N等方面具有较好的性能.
2018, 29(11):3388-3399. DOI: 10.13328/j.cnki.jos.005474
摘要:服务质量预测在服务计算领域中是一个热点研究问题.在历史QoS数据稀疏的情况下,设计一个满足用户个性化需求的服务质量预测方法成为一项挑战.为了解决这一挑战问题,提出一种基于SOM神经网络的服务质量预测方法SOMQP.首先,基于历史QoS数据,应用SOM神经网络算法分别对用户和服务进行聚类,得到用户关系矩阵和服务关系矩阵;进而,综合考虑用户信誉和服务关联性,采用一种新的Top-k选择机制获得相似用户和相似服务;最后,采用基于用户和基于项目的混合策略对缺失的QoS值进行预测.在真实的数据集WS-Dream上进行了大量实验,结果表明,与经典的CF算法和K-means算法相比,该方法在较大程度上提高了QoS的预测精度.
2018, 29(11):3400-3411. DOI: 10.13328/j.cnki.jos.005622
摘要:随着软件精化验证方法以及Isabella/HOL、VCC等验证工具不断取得进展,研究者们开始采用精化方法和验证工具设计、建模安全协议和验证安全协议源程序的正确性.在介绍Event-B方法和验证工具Isabella/HOL、VCC的基础上,综述了基于Event-B方法的安全协议形式化设计、建模与源程序验证的典型研究工作,主要包括从需求规范到消息传递形式协议的安全协议精化设计、基于TPM(trusted platform module)的安全协议应用的精化建模以及从消息传递形式协议到代码的源程序精化验证.
2018, 29(11):3412-3434. DOI: 10.13328/j.cnki.jos.005291
摘要:近年来,软件可信一直是人们争论的焦点.一种比较共识的观点认为,软件可信是软件行为符合预期的程度.质量形成于过程,显然,建立质量信心的证据也散布于过程.软件开发过程中,主体、行为和各种保障手段则是建立软件可信的基本依据.基于证据的决策和管理是现代质量理论的核心,基于证据、数据驱动的软件工程都是试图从客观数据的角度去解决问题.在国家自然科学基金等计划的支持下,从过程保障的角度提出了软件过程可信度模型,其中,证据作为建立软件可信、支持可信评估的基础要素,是模型非常重要且基础的组成部分.主要研究该模型中的证据体系,遵循完整性、必要性、兼容性和可持续性这4项原则,基于过程管理的基本要素,通过调研以及与CMMI等软件过程参考模型的对接来提炼、定义和质证模型中的可信证据,使证据具备良好的公信力和可比性;同时,增加了部分目前其他模型都没有涉及的证据来刻画对软件过程的可信增强,从而建立了一个从可信实体、可信行为、可信制品这3个目标进行可信保障、并覆盖软件过程全生命周期的证据体系.该证据体系科学、客观并具有良好的公信力,结合可信度模型的其他部分,可以实现基于证据的、自底向上的软件过程可信评估,可供软件组织广泛采用.
2018, 29(11):3435-3454. DOI: 10.13328/j.cnki.jos.005294
摘要:云计算环境下,软件通过互联网向租户提供服务,这种基于互联网的软件交付模式称为SaaS(软件即服务).与传统软件交付模式相比,SaaS软件通常运行于软件供应商的服务器端,同时为多个租户提供服务.由于需要支持不同租户的个性化需求,SaaS软件应具备足够的灵活性,以应对快速变化的租户需求;而且针对某一个租户的变更,不应影响其他租户.通过扩展课题组前期开发的基于可变性管理的适应性服务组装方法及其支持平台,提出了一种云计算环境下可复用、可定制的SaaS软件开发方法,开发了相应的支持平台,包括支持SaaS模式的服务组装引擎和远程定制工具.该方法针对不同租户的共性需求,提供一个抽象服务组装模型,支持平台在运行阶段解释执行抽象服务组装模型,根据租户的个性化需求派生不同的流程实例,这些运行时流程实例多态共存、互不影响.采用一个特定领域的SaaS软件实例来验证该方法的可行性,评估了支持平台的性能.实验结果表明,该方法及其支持平台可以支持多实例多租户的交付模式.
2018, 29(11):3455-3483. DOI: 10.13328/j.cnki.jos.005304
摘要:为了解决软件过程数据因活动信息及案例属性的缺失而无法应用传统过程挖掘方法的问题,以软件过程数据为研究对象,提出了一种双层次的软件过程挖掘方法.在活动层,提出加权结构连接向量模型对过程日志进行向量化,通过平均活动熵来确定过程日志模糊聚类的结果,将聚类结果作为活动信息支持后续挖掘工作的开展;在过程层,以启发式关系度量为基础,针对非完全循环进行研究,提出了过程层单触发序列循环划分的日志完备性条件,并进一步给出了循环归属的度量方法.基于大量真实软件过程数据的实验结果表明了双层次的软件过程挖掘方法的可行性及正确性.
2018, 29(11):3484-3499. DOI: 10.13328/j.cnki.jos.005292
摘要:通过语义分析,提出了一种拓展的粗糙集不确定性度量公理化定义;将香农熵函数推广到严凹函数,提出了一类以条件概率为自变量、基于严凹函数的粗糙集不确定性度量公式,它是严凹函数值的加权平均.在此基础上,得到一系列粗糙集不确定性度量方法.从严凹函数视角讨论了基于模糊熵的不确定性度量方法,发现现有多种能够用于度量粗糙集不确定性的模糊熵函数都是所提出方法的特殊情形.比较了粗糙度、改进粗糙度和所提出方法的区别和联系,最后设计了一些算例,比较了各种方法的异同,验证了基于严凹函数的粗糙集不确定性度量与粗糙集不确定性语义是一致的.
2018, 29(11):3500-3516. DOI: 10.13328/j.cnki.jos.005297
摘要:定位技术的普遍应用,使得随时随地获取个人位置成为可能,进一步推动了基于位置的服务等新型应用的发展,产生了海量轨迹数据.精确的路网匹配对提高这些新型应用的服务质量具有重要的研究意义,然而受众多因素的影响,大部分轨迹的采样率较低,比如由签到类应用或低功耗设备生成的低采样轨迹,给路网匹配带来了巨大的挑战.研究基于偏好的个性化路网匹配(driving preference based personalized map-matching,简称DPMM),提出了在动态道路交通网络中的用户驾驶偏好模型.基于该模型,提出了两阶段路网匹配算法:局部匹配搜索用户最可能采用的几条局部Skyline路径;设计了全局匹配的动态规划算法,该算法返回在用户驾驶偏好下最可能的多条全局路径作为最终匹配结果.实验结果充分表明,该方法是有效的和高效的,具有一定的使用价值.
2018, 29(11):3517-3527. DOI: 10.13328/j.cnki.jos.005298
摘要:#SAT在人工智能领域取得了广泛应用,很多现实问题可以规约成#SAT进行求解,得到命题理论的模型个数.通过对基于扩展规则的#SAT求解器的深入研究,发现选择规约子句的顺序对极大项空间的大小有着较大的影响,因此提出两种加速#SAT求解的启发式策略:MW和LC&MW.MW每次选择具有最大权值的子句作为规约子句;LC&MW每次选择最长子句作为规约子句,若最长子句存在多个,则在多个最长子句中选择具有最大权值的子句作为规约子句.利用MW策略设计了算法CER_MW,利用LC&MW策略设计了算法CER_LC&MW.实验结果表明,CER_MW和CER_LC&MW相对于先前的#SAT求解算法在求解效率和求解能力上都有显著的提高.在求解效率方面,CER_MW和CER_LC&MW的求解速度是其他算法的1.4倍~100倍.在求解能力方面,CER_MW和CER_LC&MW在限定时间内可解的测试用例更多.
2018, 29(11):3528-3543. DOI: 10.13328/j.cnki.jos.005293
摘要:基于属性的环签名具有表达能力强、使用灵活、便于隐匿签名者身份等优点,因此逐渐成为相关领域的研究热点.分析结果表明,现有方案大多无法同时具备无条件强匿名性和抗合谋攻击性,并且存在属性密钥托管、签名门限固定、验证效率低下等问题.针对上述不足,首先给出分布式属性基门限环签名方案的形式化定义和安全模型,然后提出一个分布式无中心授权的属性基可变门限环签名方案.该方案采用分布式密钥生成协议,分散了属性授权机构权限,解决了属性密钥托管问题;通过在属性密钥中嵌入用户身份标识,在签名中引入用户身份模糊因子的方式,使该方案同时具备无条件强匿名性和抗合谋攻击性.另外,提出了一种适用于该方案的批验证算法,能够将验证计算量由nO(·)降为O(·)+n(其中,n为待验证签名的数量),有效提高了验证效率.在随机预言机模型和CDH困难问题假设下,该方案被证明在适应性选择消息和断言攻击下是存在性不可伪造的,并且能够抵抗由拥有互补属性集合的恶意成员发动合谋攻击.
2018, 29(11):3544-3553. DOI: 10.13328/j.cnki.jos.005296
摘要:对于分组密码,不可能差分和零相关线性分析都是很重要的分析手段.通过研究非线性组件与(AND)的性质,首先得到用于刻画SIMON轮函数差分及线性传播特性的约束式,再基于布尔可满足约束问题(SAT),提出一种普适性不可能差分和零相关路径自动化搜索算法,并利用该算法搜索得到SIMON更多的不可能差分及零相关路径.除用于自动化搜索外,该算法还可判断特定的差分对(掩码对)是否能构成一条有效不可能差分和零相关路径.此外,基于该算法,从抵抗不可能差分攻击的角度出发,给出SIMON轮函数设计中循环移位常数的选取依据.
2018, 29(11):3554-3574. DOI: 10.13328/j.cnki.jos.005330
摘要:由于能够隐藏攻击位置、避开攻击过滤、窃取用户隐私和增强攻击危害,IP匿名已被各类网络攻击广泛使用并造成极大的危害.为此,研究者们提出了IP溯源——一种能够在匿名攻击发生后揭露攻击主机身份的追踪技术.鉴于已有的IP溯源研究在面对大规模网络时存在扩展性差、处理开销大、拓扑隐私泄露等问题,提出了一种可动态扩展的高效单包溯源方法,简称SEE.该方法采用域间和域内相分离的层次化系统架构模型来弱化自治域之间的溯源联系、避免拓扑隐私泄露,并通过域内溯源网络构建、域内溯源地址分配、域内路径指纹建立和提取、域间反匿名联盟构建和域内到域间的平稳过渡等策略来改善系统的扩展性和处理开销.通过理论分析和基于大规模真实和人工互联网拓扑的仿真实验,结果表明,相对于以往方案,SEE在高效性和扩展性方面确实有了很大的改善.
2018, 29(11):3575-3593. DOI: 10.13328/j.cnki.jos.005300
摘要:非刚性点集配准是当前多个领域中的一项重要研究问题.现今流行的配准算法通常使用基于单一特征的对应关系评估与包含单一约束条件的空间变换更新,而单特征与单约束限制了其配准效果与应用领域.提出了一种基于双特征高斯混合模型和双约束空间变换的非刚性点集配准算法.首先定义了双特征描述子,并用全局特征和局部特征构建它;随后,基于此描述子将高斯混合模型改进为双特征高斯混合模型.定义了局部结构约束项,并与全局结构约束项分别维护点集在进行空间变换更新时的局部与全局结构稳定.通过交替进行基于双特征高斯混合模型评估点集之间的对应关系和基于高斯径向基函数(Gaussian radial basis function)更新双约束空间变换,使该算法准确地完成非刚性点集配准.通过人造点集配准、CMU序列图像配准、遥感图像配准、IMM人脸数据配准和真实图像特征点配准对该算法进行了性能测试,同时也与当前流行的8种算法进行了性能比较实验,该算法展现出了卓越的非刚性配准性能,并在大部分实验中超越了当前的相关算法.