

第1页 / 共107页

第2页 / 共107页

第3页 / 共107页

第4页 / 共107页

第5页 / 共107页

第6页 / 共107页

第7页 / 共107页

第8页 / 共107页
试读已结束,还剩99页,您可下载完整版后进行离线阅读
基于用户反馈的个性化检索技术研究此内容为付费资源,请付费后查看
黄金会员免费钻石会员免费
付费资源
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END
不可少的一个子模块。SCC算法的主要思想是根据搜索引擎返回摘要的特点,利用分类技术来扩展短摘要的信息,以改进摘要比较算法。该方法有效的克服了摘要文本短,内容少,无法直接比较的特点:从而改进了摘要比较的结果,进而提高了排序算法的质量。最终的实验结果验证了该方法的有效性。(4)一种无损的基于聚类的层次KNN分类算法。KNN算法是一种经典的分类算法,然而其在处理大规模训练文档时效率上存在缺陷。本文利用层次聚类算法对训练文档进行有效的组织,实现了在提高分类效率的同时,分类质量不下降。(5)在深入研究并探讨了训练数据集对分类结果的影响之后,本文提出了一种稳定的分类评测指标new-macro-F1。该评测指标具有如下优点:(a)在不同的训练数据集上,new-macro-F1表现较稳定;(b)使用新的评测指标,不同的研究工作在不同训练数据集上的性能可以直接进行比较:(℃)在给定一个分类器在某个训练数据集上的new-macro-F1值时,可以推导得到该分类器在另一个训练数据集上的分类结果(即真实的分类精度、召回率以及F1值)。(6)一个个性化检索系统原型pTianwang(PersonalizedTianwang)。它是一种基于显式用户反馈的个性化检索系统,该系统通过一个客户端来完成用户信息的搜集以及检索结果的重排序工作。用这种方式可以对不同的用户产生不同的排序效果,满足用户不同的检索目的,从而达到个性化检索的目的。关键词:搜索引擎,信息检索,个性化,相关反馈,分类ii
暂无评论内容