主页期刊介绍编委会编辑部服务介绍道德声明在线审稿编委办公编辑办公English
2018-2019年专刊出版计划 微信服务介绍 最新一期:2018年第8期
     
在线出版
各期目录
纸质出版
分辑系列
论文检索
论文排行
综述文章
专刊文章
美文分享
各期封面
E-mail Alerts
RSS
旧版入口
中国科学院软件研究所
  
投稿指南 问题解答 下载区 收费标准 在线投稿
万常选,邓松,刘喜平,廖国琼,刘德喜,江腾蛟.Web 数据源选择技术.软件学报,2013,24(4):781-797
Web 数据源选择技术
Web Data Source Selection Technologies
投稿时间:2012-09-06  修订日期:2012-12-03
DOI:10.3724/SP.J.1001.2013.04374
中文关键词:  数据集成  Web 数据源  文本  结构化与半结构化  源摘要
英文关键词:data integration  Web data source  text  structured and semi-structured  source summary
基金项目:国家自然科学基金(61173146); 江西省高等学校科技落地计划(产学研合作)(KJLD12022); 江西省教育厅科技项目(GJJ12733, GJJ12732, GJJ11729)
作者单位E-mail
万常选 江西财经大学 信息管理学院, 江西 南昌 330013
数据与知识工程江西省高校重点实验室(江西财经大学), 江西 南昌 330013 
wanchangxuan@263.net 
邓松 江西财经大学 信息管理学院, 江西 南昌 330013
数据与知识工程江西省高校重点实验室(江西财经大学), 江西 南昌 330013 
 
刘喜平 江西财经大学 信息管理学院, 江西 南昌 330013
数据与知识工程江西省高校重点实验室(江西财经大学), 江西 南昌 330013 
 
廖国琼 江西财经大学 信息管理学院, 江西 南昌 330013
数据与知识工程江西省高校重点实验室(江西财经大学), 江西 南昌 330013 
 
刘德喜 江西财经大学 信息管理学院, 江西 南昌 330013
数据与知识工程江西省高校重点实验室(江西财经大学), 江西 南昌 330013 
 
江腾蛟 江西财经大学 信息管理学院, 江西 南昌 330013
数据与知识工程江西省高校重点实验室(江西财经大学), 江西 南昌 330013 
 
摘要点击次数: 4512
全文下载次数: 4180
中文摘要:
      在Web 数据集成的过程中,如何从大量的Web 数据源集合中选择合适数量的数据源,使得在满足特定查询需求的前提下尽可能地减少所需访问的数据源数量,同时保持返回数据结果的高质量,成为Web 数据集成中的一个热点问题.以近十几年的研究实践为背景,介绍Web 数据源选择的研究沿革及现状,并对Web 数据源选择方法进行了归类.分别讨论了基于相关性的和基于质量的数据源选择的研究动机、研究方法和研究成果等,并对相关研究的目标、关键技术、优点和缺点进行了对比分析;最后展望了Web 数据源选择未来的研究方向.
英文摘要:
      In Web data integration, selecting data from a Web data source collection such that the specific query intents are satisfied while the number of accesses to data sources is minimized and the quality of returned results are guaranteed is a popular topic. In this paper, using the researches and practices in recent ten years as the background, the study focuses on the evolution and presents research in the area of Web data source selection and classifies Web data source selection methods. In addition, the paper discusses the research motivations, methods and results of relevance-based data source selection and quality-based data source selection. Moreover, the paper introduces the correlation research results and analyzes their destinations, key techniques, merits and demerits. Finally, some directions for future research are put forward.
HTML  下载PDF全文  查看/发表评论  下载PDF阅读器
 

京公网安备 11040202500064号

主办单位:中国科学院软件研究所 中国计算机学会
编辑部电话:+86-10-62562563 E-mail: jos@iscas.ac.cn
Copyright 中国科学院软件研究所《软件学报》版权所有 All Rights Reserved
本刊全文数据库版权所有,未经许可,不得转载,本刊保留追究法律责任的权利