
2016年第35卷第12期
传感器与微系统(Transducer and Microsystem Technologies)
41
D01:10.13873/J.10009787(2016)12004103
细粒度情感分析的酒店评论研究鸣"2,吴波”,宋阳”,朱梦尧,徐志广?,张宏俊”
李
(1.上海大学通信与信息工程学院,上海200444;
2.中国科学院上海高等研究院,上海201210;3.西安航天恒星科技实业(集团)公司,陕西西安710061)摘要:酒店在线评论细粒度挖掘具有重要研究意义。以酒店在线评论具体特征属性和情感分类为研究目标,应用Apriori算法和情感调典匹配算法,对重庆募都宾馆在线评论数据深人挖据,挖据出用户最关注的酒店十大特征和满意度结果,进一步挖掘出商务出差等五种不同出游类型人最关注的酒店五大特征和
满意度结果。这种方法不仅能对酒店领域评论进行分析,同样能够应用于其他领域。关键词:酒店在线评论;特征挖据;情感分析;细粒度;情感词典匹配
文章编号:1000-9787(2016)12-0041-03
中图分类号:TP391
文献标识码:A
Research on hotel reviews based on fine-grained
sentimentanalysis
LI Ming'-2, WU Bo”, SONG Yang”, ZHU Meng-yao', XU Zhi-guang”, ZHANG Hong-jun?
(1, School of Communication and Information Engineering,Shanghai University,
Shanghai 200444, China; 2, Shanghai Advanced Research Institute, Chinese Academy of Sciences, Shanghai 201210, China; 3. Xi'an Space Star Technology Group Co Ltd,Xi' an 710061,China)
Abstract: Fine-grained mining of hotel online reviews are of great importance, Specific feature and emotional attributes of hotel online reviews can be taken as research targets, using Apriori algorithm and semantic lexicon matching algorithm, online reviews data of Chongqing Wu Du Hotel are mined, ten features that most users oncemed and satisfaction results of the hotel can be inferred and five features of the hotel that five different kinds of travellers such as bussiness man most concemed together with corresponding degree of satisfaction results can also be mined in further exploration, This method can be applied in other fields.
Key words: hotel online reviews; feature mining; sentiment analysis; fine-grained; semantic lexicon matching
阜0
随着电子商务的快速发展,越来越多的人在网络上预订酒店并对人住体验进行在线评论。这些评论不仅有利于潜在的酒店消费者参考,也有利于商家有针对性地改善服务质量。然面,酒店评论信息量庞大允杂,给于消费者和商家查找有用的信息带来了极大的麻烦,如何方便快捷地挖掘出评论中有价值的信息逐渐成为研究热点。情感分析能从评论中获取用户的喜衰乐,了解用户对酒店的喜好程度。
传统的情感分析主要采用两类方法,基于情感词典的方法和基于机器学习的方法。2002年,TumeyPDl提出了基于种子词汇发现情感词的方法。PangB等人(3]采用了贝叶斯、最大筛、支持向量机(SVM)等机器学习的方法来构造分类器,并对这几种方法进行了对比。KobayashiN
收稿日期:201603-02
等人(3)构建了一个模式库,收录了8种命中率比较高且较准的模式用来提取评价主体、评价方面和评价之间的关系。 Marrese-TaylorE等人(*)考虑到用户对不同的产品发表的评论不同,找出旅游领域的特征,构造出更准确的自然语言处理模型用于旅游领域的挖掘。
然而,前面基于篇章、句子级别的粗粒度情感分析由于没有考虑情感所针对的具体对象,无法满足用户了解酒店各个特征属性的需求。李杰等人(")对特征提取的研究进行了全面的概括,文献[6,7]着重对酒店细粒度的情感分析进行研究:通过关联规则方法识别出评价对象特征询、情感词以及情感修饰词,并找出他们之间的关系,计算出相应的情感值,构建相关领域的属性词表和情感词表。这些方法在英文领域取得了不错的成果,但是在中文语言下的适应性不是很理想。