Opinion Word Expansion and Target Extraction through Double Propagation
Introduction
论文的引言部分介绍了意见挖掘(或称情感分析)的重要性,指出该领域受到广泛关注的原因是其广泛的应用前景和研究挑战。引言中讨论了两大关键问题:观点词汇扩展和观点目标提取。
• 观点词汇扩展:指的是在不同领域中,情感表达可能会用到不同的词汇,因此一个通用的情感词典很难满足所有领域的需求。为了提升情感分析的效果,有必要根据特定领域文本扩展已有的情感词汇表。
• 观点目标提取:即提取出文本中情感表达所指向的对象(如“电池寿命”),以便理解情感指向,增加情感分析的实际价值。
作者提出了一种基于依赖关系的双重传播方法,通过句法关系在观点词和目标词之间传播信息,逐步扩展词汇和提取目标。这种方法具有半监督的特点,因为它只需要一个初始的观点词词典来启动传播过程。实验表明,与其他现有方法相比,该方法在扩展词汇和提取目标方面均表现出更高的准确性。
Related Work
论文的相关工作部分总结了在观点词提取和目标提取方面的研究进展。
- 观点词提取:
• 语料库驱动方法:利用词的分布相似性和统计共现(如Turney和Littman的方法)来提取观点词。这类方法依赖于较大规模的语料,但在小规模数据集上表现不佳。
• 词典驱动方法:基于现有词典或语义网络(如WordNet)寻找观点词的同义词或反义词,但这种方法很难找到特定领域的情感词汇。