学海网 文档下载 文档下载导航
设为首页 | 加入收藏
搜索 请输入内容:  
 导航当前位置: 文档下载 > 所有分类 > 人文社科 > 教育学/心理学 > 基于情绪词的非监督中文情感分类方法研究

基于情绪词的非监督中文情感分类方法研究

第26卷 第4期2012年7月

中文信息学报

JOURNALOFCHINESEINFORMATIONPROCESSING    

Vol.26,No.4

,2012Jul.

()文章编号:10030077201204010306---

基于情绪词的非监督中文情感分类方法研究

代大明,王中卿,李寿山,李培峰,朱巧明

(江苏苏州21.苏州大学计算机科学与技术学院,15006;)江苏苏州22.江苏省计算机信息处理技术重点实验室,15006

。该文提出一种基于摘 要:情感分类任务旨在识别文本所表达的情感色彩信息(例如,褒或者贬,支持或者反对)使用大规模未标记数据和少量情绪词实现情感分类。具体来讲,首先使用情绪词从情绪词的中文情感分类方法,

然后采用半监督学习方法训练分类器进行情感分类。未标注数据中抽取高正确率的自动标注数据作为训练样本,

实验表明,该文提出的方法在产品评论与酒店评论两个领域的情感分类任务中取得了较好地分类效果。关键词:情感分类;情绪词;非监督学习;协同训练中图分类号:TP391    文献标识码:A

UnsuervisedChineseSentimentClassificationwithEmotionWords      p

,WAN,,,DAIDaminGZhoninLIShoushanLIPeifenZHU Qiaomin    ggqggg

(,,,;1.SchoolofComuterScience&TechnoloSoochow UniversitSuzhouJiansu215006,China     pgyyg

,,)2.ProvincialKeLabofComuterInformationProcessinTechnoloofJiansuSuzhouJiansu215006,China       ypggygg   :,AbstractSentimentclassificationistodistinuishthetextbetweentheexressedsentimentcateoriessuchasosi             -gpgptivevs.neativeorareevs.disaree.Thisaimstounsuervisedsentimentclassificationwithonlaererform             gggpyppp,unlabeleddataandasmallscaleofemotionwords.Indetailwefirstladotedtheemotionwordstoextracttheau                 -yp ,recisionerformtomaticalllabeledsamleswithhihandthenusedthesesamleswiththeunlabeledsamlesto-              ppypgppsemisuervisedlearninforsentimentclassification.Exerimentalresultsdemonstratethatthisaroachcana-          -pgppp chieveaooderformanceforthetaskofsentimentclassificationinbothroductandhoteldomains.               gpp:;;;Kewordssentimentclassificationemotionwordsunsuervisedlearnincotrainin   -pggy 

倾向进行褒贬分类。与传统基于主题的文本分类相

1 引言

随着W互联网上相继出现了大eb2.0的发展, 

这迫切需要计算机帮助商量关于观点的评论文本,

业公司或用户自动分析和获取这些文本的情感信)息。情感分析(即为该背景下出sentimentanalsis y现的一个面向文本情感信息处理的新兴研究

1]

。方向[

2]

。到目前为止,比,情感分类被认为更具有挑战性[

大多数针对情感分类的研究是基于监督学习的,虽然取得了较好的分类效果,但由于这种方法需要大量标注语料使得构建分类器的时间和经济代价比较大。因此,后续研究出现了一些基于少量标注数据

3]

。的半监督学习方法,并取得了不错的成绩[

由于情感分类是领域相关(domainsecific)-p的,在牵涉到多个领域的时候,对所有领域都标注少量数据仍然非常费时费力。在这种情况下,无需标注语料的非监督情感分类方法显得非常实用。本文

)情感分类(是情感分析sentimentclassification 研究的一个基本任务,该任务旨在将文本按照情感

收稿日期:2011092120120224-- 定稿日期:--

;;基金项目:国家自然科学基金(高等学校博士学科点专项科研基金(60970056,61070123,61003155)20093201110006)模式识别国家重点实验室开放课题基金

,,作者简介:代大明(男,硕士研究生,主要研究方向为自然语言处理;王中卿(男,硕士研究生,主要研究1985—)1987—),李寿山(男,副教授,硕士生导师,主要研究方向为自然语言处理。方向为自然语言处理;1980—)

第1页

我要评论

相关文档

  • 基于情绪词的非监督中文情感分类方法研究

    (020-13010-0721)400-6 基于情绪词的非监督中文情感分类方法研究代大明 , 王中卿 , 李寿山 , 李培峰 , 朱巧明( 苏州大学 计算机科学与技术学院, 江苏 苏州 ...

  • 基于情绪知识的中文微博情感分类方法

    本文通过对中文微博的研究与分析,提出一种利用情绪 知识实现微博上非监督的情感文本分类方法,通过情绪知识 从大规模未标注语料中自动获取伪标注语料,然后利用这些 ...

  • 网络环境下中文情感倾向的分类方法

    基于情绪词的非监督中文... 6页 免费 情感分类中情感词的情感... 7页 ...国外在进行文本情感研究时结合语言学提出了基于语义倾向分析的方法来对文本的情感...

  • 基于随机特征子空间的半监督情感分类方法研究

    基于情绪词的非监督中文情... 6页 免费 一种基于粒运算的文本情感... ...(020-05010-0721)408-6 基于随机特征子空间的半监督情感分类方法研究苏 艳, ...

  • 基于统计的中文词自动分类研究

    基于情绪词的非监督中文情... 6页 免费 情感分类中情感词的情感倾... 7...Computational 李涓子 1999 汉语词义排歧方法研究,清华大学博士论文。 C-H Chang...

  • 中文微博情感分析方法研究

    情感分类的主要原因进行了归纳总结,为情感 分析方法...进一步研究提供了参考方向. 关键词:中文微博;情感...基于情绪知识的中文微博 情感分类方法〔J〕.计算机...

  • 基于内容和情感的文本分类方法研究(硕士学位论文)

    基于内容和情感的文本分类方法研究(硕士学位论文)_...关键词:文本分类;情感挖掘;中文分词;特征项选择;隐...采用基于 CRFs 模型的半监督迭代算法获取大量评价词...

  • 基于不平衡数据的情感分类的分析研究

    最后,本文提出了基于监督学习的不平衡情感分类方法...能有效利用非标注样 I 中文摘要 基于不平衡数据的...极性转移通常指句子中情 感词的极性和整个句子的极性...

  • 情绪情感的分类

    情绪情感分类 2页 免费 情绪情感分类 8页 免费 基于情绪词的非监督中文...妥协的心理自我防卫形式,是一种采取折衷的办法对待其所遭到的挫折,消除心理上不...

更多文档:

站点地图 | 文档上传 | 侵权投诉 | 手机版
新浪认证  诚信网站  绿色网站  可信网站   非经营性网站备案
本站所有资源均来自互联网,本站只负责收集和整理,均不承担任何法律责任,如有侵权等其它行为请联系我们.
文档下载 Copyright 2013 doc.xuehai.net All Rights Reserved.  email
返回顶部