主页期刊介绍编委会编辑部服务介绍道德声明在线审稿编委办公编辑办公English
2018-2019年专刊出版计划 微信服务介绍 最新一期:2019年第8期
     
在线出版
各期目录
纸质出版
分辑系列
论文检索
论文排行
综述文章
专刊文章
美文分享
各期封面
E-mail Alerts
RSS
旧版入口
中国科学院软件研究所
  
投稿指南 问题解答 下载区 收费标准 在线投稿
彭云,万常选,江腾蛟,刘德喜,刘喜平,廖国琼.基于语义约束LDA的商品特征和情感词提取.软件学报,2017,28(3):676-693
基于语义约束LDA的商品特征和情感词提取
Extracting Product Aspects and User Opinions Based on Semantic Constrained LDA Model
投稿时间:2016-07-03  修订日期:2016-09-14
DOI:10.13328/j.cnki.jos.005154
中文关键词:  LDA模型  语义约束  商品特征  情感词
英文关键词:latent Dirichlet allocation model  semantic constraint  product aspect  opinion word
基金项目:国家自然科学基金(61562032,61662032,61662027,61173146,61363039,61363010,61462037,61562031);江西省自然科学基金重大项目(20152ACB20003);江西省高等学校科技落地计划(KJLD12022,KJLD14035)
作者单位E-mail
彭云 江西财经大学 信息管理学院, 江西 南昌 330013
江西师范大学 计算机信息工程学院, 江西 南昌 330022
数据与知识工程江西省高校重点实验室(江西财经大学), 江西 南昌 330013 
 
万常选 江西财经大学 信息管理学院, 江西 南昌 330013
数据与知识工程江西省高校重点实验室(江西财经大学), 江西 南昌 330013 
wanchangxuan@263.net 
江腾蛟 江西财经大学 信息管理学院, 江西 南昌 330013
数据与知识工程江西省高校重点实验室(江西财经大学), 江西 南昌 330013 
 
刘德喜 江西财经大学 信息管理学院, 江西 南昌 330013
数据与知识工程江西省高校重点实验室(江西财经大学), 江西 南昌 330013 
 
刘喜平 江西财经大学 信息管理学院, 江西 南昌 330013
数据与知识工程江西省高校重点实验室(江西财经大学), 江西 南昌 330013 
 
廖国琼 江西财经大学 信息管理学院, 江西 南昌 330013
数据与知识工程江西省高校重点实验室(江西财经大学), 江西 南昌 330013 
 
摘要点击次数: 694
全文下载次数: 716
中文摘要:
      随着网络购物的发展,Web上产生了大量的商品评论文本数据,其中蕴含着丰富的评价知识.如何从这些海量评论文本中有效地提取商品特征和情感词,进而获取特征级别的情感倾向,是进行商品评论细粒度情感分析的关键.根据中文商品评论文本的特点,从句法分析、词义理解和语境相关等多角度获取词语间的语义关系,然后将其作为约束知识嵌入到主题模型,提出语义关系约束的主题模型SRC-LDA(semantic relation constrained LDA),用来实现语义指导下LDA的细粒度主题词提取.由于SRC-LDA改善了标准LDA对于主题词的语义理解和识别能力,从而提高了相同主题下主题词分配的关联度和不同主题下主题词分配的区分度,可以更多地发现细粒度特征词、情感词及其之间的语义关联性.实验结果表明,SRC-LDA对于细粒度特征和情感词的发现和提取具有较好的效果.
英文摘要:
      With the development of online shopping, the Web has produced a large quantity of product reviews containing abundant evaluation knowledge about products. How to extract aspect and opinion words from the reviews and further obtain the sentiment polarity of the products at aspect level is the key problems to solve in fine-grained sentiment analysis of product reviews. First, considering certain features of Chinese product reviews, this paper designs methods to derive semantic relationships among words through syntactic analysis, word meaning understanding and context relevance, and then embed them as constrained knowledge into the topic model. Second, a semantic relation constrained topic model called SRC-LDA is proposed to guide the LDA to extract fine-grained topical words. Through the improvement of semantic comprehension and recognition ability of topical words in standard LDA, the proposed model can increase the words correlation under the same topic and the discrimination under the different topics, thus revealing more fine-grained aspect words, opinion words and their semantic associations. The experimental results show that SRC-LDA is an effective approach for fine-grained aspects and opinion words extraction.
HTML  下载PDF全文  查看/发表评论  下载PDF阅读器
 

京公网安备 11040202500064号

主办单位:中国科学院软件研究所 中国计算机学会 京ICP备05046678号-4
编辑部电话:+86-10-62562563 E-mail: jos@iscas.ac.cn
Copyright 中国科学院软件研究所《软件学报》版权所有 All Rights Reserved
本刊全文数据库版权所有,未经许可,不得转载,本刊保留追究法律责任的权利