分享文章中关键词的提取与拓展方法
在自然语言处理领域,处理海量文本文件的关键是提取用户关心的问题。无论是长文本还是短文本,我们都可以通过几个关键词来窥视整个文本的主题。同时,无论是基于文本的推荐还是基于文本的搜索,对文本关键字的依赖性也很大。关键词提取的准确性直接关系到推荐系统或搜索系统的终效果。 因此,关键字提取是文本挖掘领域的一个重要组成部分。从文本中提取关键词有三种方法:监督、半监督和无监督。监督关键字提取算法是将关键字提取算法构造为两类问题来判断文档中的词或短语是否为关键字。由于这是一个分类问题...