主页期刊介绍编委会编辑部服务介绍道德声明在线审稿编委办公编辑办公English
2018-2019年专刊出版计划 微信服务介绍 最新一期:2018年第10期
     
在线出版
各期目录
纸质出版
分辑系列
论文检索
论文排行
综述文章
专刊文章
美文分享
各期封面
E-mail Alerts
RSS
旧版入口
中国科学院软件研究所
  
投稿指南 问题解答 下载区 收费标准 在线投稿
姜涛,李战怀,尚学群,陈伯林,李卫榜,殷知磊.基于数字签名与Trie的保序子矩阵约束查询.软件学报,2017,28(8):2175-2195
基于数字签名与Trie的保序子矩阵约束查询
Constrained Query of Order-Preserving Submatrix Based on Signature and Trie
投稿时间:2016-01-20  修订日期:2016-05-20
DOI:10.13328/j.cnki.jos.005124
中文关键词:  基因表达数据  OPSM(order-preserving submatrix)  约束查询  数字签名  Trie  枚举序列
英文关键词:gene expression data  order-preserving submatrix (OPSM)  constrained query  signature  Trie  enumerated sequence
基金项目:国家重点基础研究发展计划(973)(2012CB316203);国家自然科学基金(61033007,61272121,61332014,61572367,61472321,61502390);国家高技术研究发展计划(863)(2015AA015307);中央高校基本科研业务费专项资金(3102015JSJ0011);西北工业大学研究生创业种子基金(Z2012128)
作者单位E-mail
姜涛 西北工业大学 计算机学院, 陕西 西安 710072  
李战怀 西北工业大学 计算机学院, 陕西 西安 710072  
尚学群 西北工业大学 计算机学院, 陕西 西安 710072  
陈伯林 西北工业大学 计算机学院, 陕西 西安 710072  
李卫榜 西北工业大学 计算机学院, 陕西 西安 710072 wbli2003@163.com 
殷知磊 西北工业大学 计算机学院, 陕西 西安 710072  
摘要点击次数: 654
全文下载次数: 453
中文摘要:
      目前,基因芯片技术飞速发展,促使生物学家积累了大量的不同实验条件下的基因表达数据.事实证明,基因芯片数据分析在理解基因功能、基因调控和分子生命过程中发挥着重要作用.保序子矩阵(order-preserving submatrix,简称OPSM)是基因芯片数据分析技术中的一种有效模型,其可以发现在部分基因和不同实验条件下具有相同表达趋势的聚类.在分析基因表达机理的过程中,OPSM的检索无疑节省了生物学家的时间与精力.目前,OPSM的查询主要是基于关键词的检索方法,但是分析者对结果具有微弱的控制力.通常,分析者所能决定的临时的参数设置往往偏离其领域知识,致使检索结果与真实想要的结果相去甚远.为了解决上述问题,提出两类基于数字签名与Trie的OPSM索引与约束查询方法.在真实数据上进行了大量的实验,实验结果表明,所提出的方法具有良好的有效性与可扩展性.
英文摘要:
      The advances of microarray technology have made large amount of gene expression data available from a variety of different experimental conditions. Analyzing the microarray data plays a key role in understanding gene functions, gene regulation and cellular process. Order-Preserving Submatrix (OPSM) is an important model in microarray data analysis, which captures the identical tendency of gene expressions across a subset of conditions. In the process of analyzing mechanism of gene expression, OPSM search undoubtedly saves the time and effort of biologists. However, OPSM retrieval mainly depends on keyword search, resulting a weak control on the obtained clusters. Typically, the analyst can determine the ad-hoc parameters which are far from the declarative specification of desired properties on operation and concept. Motivated by obtaining much more accurate query relevancy, this paper proposes two types of OPSM indexing and constrained query methods based on signature and Trie. Extensive experiments conducted on real datasets demonstrate the proposed methods have better behaviors than the state-of-the-art methods on efficiency and effectiveness.
HTML  下载PDF全文  查看/发表评论  下载PDF阅读器
 

京公网安备 11040202500064号

主办单位:中国科学院软件研究所 中国计算机学会
编辑部电话:+86-10-62562563 E-mail: jos@iscas.ac.cn
Copyright 中国科学院软件研究所《软件学报》版权所有 All Rights Reserved
本刊全文数据库版权所有,未经许可,不得转载,本刊保留追究法律责任的权利