编程开源技术交流,分享技术与知识

网站首页 > 开源技术 正文

记录配置solr中文同义词检索过程供大家学习

wxchong 2024-07-16 10:52:26 开源技术 8 ℃ 0 评论

1配置同义词首先是要基于中文分词的基础上进行的,如果检索关键词不能够进行中文分词那么是查询不到相关的同义词的(如果solr没有配置同义词,请参考附录进行配置,配置完成后进行后续操作)

2 如果是IKAnalyzer中文分词修改fileType text_ik,如果是mmseg4j中文分词修改fileType text_mmseg4j,添加同义词的filter,<filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true" />如下图所示:

或者

3修改C:\solr\apache-solr-3.4.0\example\multicore\core0\conf\synonyms.txt添加 台湾,台灣,臺灣 南京,金陵,建康这些词语都是表示一个意思,修改完之后另存为UTF-8格式,要不然是不会起效果的。

4 reindex solr数据并重启tomcat之后查询分词结果,如下面的红框结果代表同义词添加成功。

5 输入建康查询到三笔数据,分别是南京,金陵,建康,整合完成。

Tags:

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表