主页期刊介绍编委会编辑部服务介绍道德声明在线审稿编委办公编辑办公English
     
在线出版
各期目录
纸质出版
分辑系列
论文检索
论文排行
综述文章
专刊文章
美文分享
各期封面
E-mail Alerts
RSS
旧版入口
中国科学院软件研究所
  
投稿指南 问题解答 下载区 收费标准 在线投稿
郑皎凌,乔少杰,舒红平,应广华,Louis Alberto GUTIERREZ.面向多维稀疏数据仓库的欺诈销售行为挖掘.软件学报,2020,31(3):710-725
面向多维稀疏数据仓库的欺诈销售行为挖掘
Sale Fraud Behavior Detection over Multidimensional Sparse Data Warehouse
投稿时间:2019-07-20  修订日期:2019-09-10
DOI:10.13328/j.cnki.jos.005905
中文关键词:  分析渠道欺诈  人工智能  挂单模式  张量  偏序格
英文关键词:distribution channel fraud  artificial intelligence  deal cheating pattern  tensor  partially ordered lattice
基金项目:国家自然科学基金(61772091,61802035,61962006);四川省科技计划(20YYJC2785,2018JY0448,2019YFG0106,2019YFS0067);四川高校科研创新团队建设计划(18TD0027);广西自然科学基金(2018GXNSFDA138005);成都信息工程大学科研基金(KYTZ201715,KYTZ201750);成都信息工程大学中青年学术带头人科研基金(J201701);广东省普及型高性能计算机重点实验室项目(2017B030314073)
作者单位E-mail
郑皎凌 软件自动生成与智能服务四川省重点实验室(成都信息工程大学), 四川 成都 610225
成都信息工程大学 软件工程学院, 四川 成都 610225 
 
乔少杰 软件自动生成与智能服务四川省重点实验室(成都信息工程大学), 四川 成都 610225
成都信息工程大学 软件工程学院, 四川 成都 610225 
sjqiao@cuit.edu.cn 
舒红平 软件自动生成与智能服务四川省重点实验室(成都信息工程大学), 四川 成都 610225
成都信息工程大学 软件工程学院, 四川 成都 610225 
 
应广华 阿里巴巴技术有限公司, 浙江 杭州 311121  
Louis Alberto GUTIERREZ Department of Computer Science, Rensselaer Polytechnic Institute, New York, USA  
摘要点击次数: 149
全文下载次数: 85
中文摘要:
      分销渠道系统中,产品制造商会分配给销售额较大的分销商更多返点利润鼓励销售,而分销商之间可能会联合起来将多个分销商的销售业绩累计在其中一个分销商上,获取高额利润,这种商业欺诈行为被称为挂单或窜货.由于数据中大量正常极值点的存在,使得传统异常探测算法很难区分正常极值和由挂单导致的异常极值;另外,多维销售数据本身就存在的稀疏性导致多维数据异常探测算法无法有效运行.为了克服上述问题,将人工智能和数据库技术结合起来,提出了基于分割率的特征提取方法和基于张量重构的挂单行为挖掘算法.同时,由于分销商之间存在多种挂单行为,设计了基于挂单模式偏序格的特征提取方法来对销售数据集中存在的挂单行为进行分类.在合成数据的实验中,所提出的挂单点挖掘算法能达到65%的平均AUC值,而传统特征提取方法仅达到36%和30%的平均AUC值.在真实数据上的实验结果表明,挂单行为探测方法能区分正常销售极值和挂单行为产生的异常极值.
英文摘要:
      In distribution channel system, product manufacturer will often reward retail trader who makes big deal to increase the sales. On the other hand, in order to obtain high reward, retail traders may form alliance, where a cheating retail trader accumulates the deals of other retail traders. This type of commercial fraud is called deal cheating or cross region sale. Because the sales contain a lot of normal big deals, traditional outlier detection methods cannot distinguish the normal extreme value and the true outlier generated by deal cheating behavior. Meanwhile, the sparsity of the multidimensional sales data makes the outlier detection methods based on multidimensional space cannot work effectively. To handle the aforementioned problems, this study proposes deal cheating mining algorithms based on ratio characteristic and tensor reconstruction method. These algorithms combine artificial intelligence and database technique. Meanwhile, because there are multiple types of deal cheating patterns, this study proposes deal cheating pattern classification methods based on the partially ordered lattice of deal cheating patterns. In the experiments on synthetic data, the deal cheating detection algorithm based on the ratio characteristic can achieve an average AUC-value of 65%. The traditional feature extraction methods can only achieve average AUC-values of 36% and 30%. In the experiments on the real data, the results shows the deal cheating detection algorithm is capable of distinguishing normal big deal from abnormal big deal which may be generated by the deal cheating behaviors.
HTML  下载PDF全文  查看/发表评论  下载PDF阅读器
 

京公网安备 11040202500064号

主办单位:中国科学院软件研究所 中国计算机学会 京ICP备05046678号-4
编辑部电话:+86-10-62562563 E-mail: jos@iscas.ac.cn
Copyright 中国科学院软件研究所《软件学报》版权所有 All Rights Reserved
本刊全文数据库版权所有,未经许可,不得转载,本刊保留追究法律责任的权利