主页期刊介绍编委会编辑部服务介绍道德声明在线审稿编委办公English
2022年专刊出版计划 微信服务介绍 最新一期:2021年第2期
     
在线出版
各期目录
纸质出版
分辑系列
论文检索
论文排行
综述文章
专刊文章
美文分享
各期封面
E-mail Alerts
RSS
旧版入口
中国科学院软件研究所
  
投稿指南 问题解答 下载区 收费标准 在线投稿
李勇敢,周学广,孙艳,张焕国.中文微博情感分析研究与实现.软件学报,2017,28(12):3183-3205
中文微博情感分析研究与实现
Research and Implementation of Chinese Microblog Sentiment Classification
投稿时间:2016-05-19  修订日期:2017-01-24
DOI:10.13328/j.cnki.jos.005283
中文关键词:  中文微博  情感分析  依存分析  情感倾向性分类  情感要素抽取  无监督主题情感模型
英文关键词:Chinese Microblog  sentiment analysis  dependency parsing  emotion tendency classification  emotion expression extraction  unsupervised topic sentiment model
基金项目:国家重点基础研究发展计划(973)(2014CB340600);国家自然科学基金(61332019,61672531);国家社会科学基金(14GJ003-152)
作者单位E-mail
李勇敢 武汉大学 计算机学院, 湖北 武汉 430079  
周学广 海军工程大学 信息安全系, 湖北 武汉 430033 zxg196610@hotmail.com 
孙艳 中国人民解放军 92941 部队, 辽宁 葫芦岛 125000  
张焕国 武汉大学 计算机学院, 湖北 武汉 430079  
摘要点击次数: 2918
全文下载次数: 3969
中文摘要:
      中文微博的大数据、指数传播和跨媒体等特性,决定了依托人工方式监控和处理中文微博是不现实的,迫切需要依托计算机开展中文微博情感自动分析研究.该项研究可分为3个任务:中文微博观点句识别、情感倾向性分类和情感要素抽取.为完成上述任务,研制了一个评测系统:通过构建多级词库、制定成词规则、开展串频统计等给出一种基于规则和统计的新词识别方法,在情感词和评价对象的依存模式的基础上给出基于词语特征的观点句识别算法;以词序流表示文本的LDA-Collocation模型,采用吉布斯抽样法推导了算法,实现中文微博情感倾向性自动分类;针对中文微博情感要素抽取召回率较低的问题,利用依存关系分析理论,按主语类和宾语类把依存模式分为两类,建立了6个优先级的评价对象和情感词汇的依存模式,通过评价对象归并算法实现计算机自动抽取情感要素.实验包括两个部分:一是参加NLP&CC2012的公开评测,所提方法在微博观点句识别任务中的准确率为第2,在中文微博情感要素抽取任务中的准确率和F值均为第2,验证了该算法的实用性;二是在分析公开评测结果的基础上,分别比较了参加公开评测的各类算法在处理中文微博情感分析时的效率,给出了相关结论.
英文摘要:
      This paper studies sentiment analysis in Weibo. The study focuses on three types of tasks:emotion sentence identification and classification, emotion tendency classification, and emotion expression extraction. An unsupervised topic sentiment model, UTSM, is proposed based on the LDA Collocation model to facilitate automatic hashtag labeling. A Gibbs sampling implementation is presented for deriving an algorithm that can be used to automatically categorize emotion tendency with computer. To address the issue of lower recall ratio for emotion expression extraction in Weibo, dependency parsing is used to divide dependency model into two categories with subject and object. Six dependency models are also constructed from evaluation objects and emotion words, and a merging algorithm is proposed to accurately extract emotion expression. Result of experiments indicates that the presented method has a strong innovative and practical value.
HTML  下载PDF全文  查看/发表评论  下载PDF阅读器
 

京公网安备 11040202500064号

主办单位:中国科学院软件研究所 中国计算机学会 京ICP备05046678号-4
编辑部电话:+86-10-62562563 E-mail: jos@iscas.ac.cn
Copyright 中国科学院软件研究所《软件学报》版权所有 All Rights Reserved
本刊全文数据库版权所有,未经许可,不得转载,本刊保留追究法律责任的权利