主页期刊介绍编委会编辑部服务介绍道德声明在线审稿编委办公编辑办公English
2018-2019年专刊出版计划 微信服务介绍 最新一期:2018年第10期
     
在线出版
各期目录
纸质出版
分辑系列
论文检索
论文排行
综述文章
专刊文章
美文分享
各期封面
E-mail Alerts
RSS
旧版入口
中国科学院软件研究所
  
投稿指南 问题解答 下载区 收费标准 在线投稿
敖 莉,舒继武,李明强.重复数据删除技术.软件学报,2010,21(5):916-929
重复数据删除技术
Data Deduplication Techniques
投稿时间:2008-06-04  修订日期:2009-10-09
DOI:
中文关键词:  网络存储系统  重复数据  数据删除  可靠性  性能
英文关键词:network storage system  duplicate data  data elimination  reliability  performance
基金项目:Supported by the National Natural Science Foundation of China under Grant No.60873066 (国家自然科学基金); the NationalHigh-Tech Research and Development Plan of China under Grant No.2009AA01A403 (国家高技术研究发展计划(863)); the SpecializedResearch Fund for the Doctoral Program of Higher Education of China under Grant No.200800030027 (高等学校博士学科点专项科研基金)
作者单位
敖 莉 清华大学 计算机科学与技术系,北京 100084 
舒继武 清华大学 计算机科学与技术系,北京 100084 清华大学 信息科学与技术国家实验室(筹),北京 100084 
李明强 清华大学 计算机科学与技术系,北京 100084 
摘要点击次数: 7648
全文下载次数: 10853
中文摘要:
      重复数据删除技术主要分为两类:相同数据的检测技术和相似数据的检测与编码技术,系统地总结了 这两类技术,并分析了其优缺点.此外,由于重复数据删除技术会影响存储系统的可靠性和性能,又总结了针对这 两方面的问题提出的各种技术.通过对重复数据删除技术当前研究现状的分析,得出如下结论:a) 重复数据删除 中的数据特性挖掘问题还未得到完全解决,如何利用数据特征信息有效地消除重复数据还需要更深入的研 究;b) 从存储系统设计的角度,如何引入恰当的机制打破重复数据删除技术的可靠性局限并减少重复数据删除技术带来的额外系统开销也是一个需要深入研究的方面.
英文摘要:
      Data deduplication technologies can be divided into two categories: a) identical data detection techniques, and b) similar data detection and encoding techniques. This paper presents a systematic survey on these two categories of data deduplication technologies and analyzes their advantages and disadvantages. Besides, since data deduplication technologies can affect the reliability and performance of storage systems, this paper also surveys various kinds of technologies proposed to cope with these two aspects of problems. Based on the analysis of the current state of research on data deduplication technologies, this paper makes several conclusions as follows: a) How to mine data characteristic information in data deduplication has not been completely solved, and how to use data characteristic information to effectively eliminate duplicate data also needs further study; b) From the perspective of storage system design, it still needs further study how to introduce proper mechanisms to overcome the reliability limitations of data deduplication techniques and reduce the additional system overheads caused by data deduplication techniques.
HTML  下载PDF全文  查看/发表评论  下载PDF阅读器
 

京公网安备 11040202500064号

主办单位:中国科学院软件研究所 中国计算机学会
编辑部电话:+86-10-62562563 E-mail: jos@iscas.ac.cn
Copyright 中国科学院软件研究所《软件学报》版权所有 All Rights Reserved
本刊全文数据库版权所有,未经许可,不得转载,本刊保留追究法律责任的权利