编程开源技术交流,分享技术与知识

网站首页 > 开源技术 正文

es-ik实现热更新词库(es更新字段)

wxchong 2024-10-23 15:50:04 开源技术 7 ℃ 0 评论

1:部署http服务

在这使用tomcat7作为web容器,先下载一个tomcat7,然后上传到某一台服务器上(192.168.80.100)。

再执行以下命令

tar -zxvf apache-tomcat-7.0.73.tar.gz

cd apache-tomcat-7.0.73/webapp/ROOT

vi hot.dic

验证一下这个文件是否可以正常访问

http://192.168.80.100:8080/hot.dic

2:修改ik插件的配置文件

cd elasticsearch-2.4.3/plugins/ik/config

vi IKAnalyzer.cfg.xml

修改key=remote_ext_dict 的entry 中的内容

3:验证

重启es,会看到如下日志信息,说明远程的词典加载成功了。

执行下面命令查看分词效果

正常情况下北京雾霾会分为多个词语,但是我们希望es把[北京雾霾]作为一个完整的词,又不希望重启es。

这样就需要修改前面的hot.dic文件,增加一个词语[北京雾霾]

vi hot.dic

文件保存之后,查看es的日志会看到如下日志信息

再执行下面命令查看分词效果

到这为止,可以实现动态添加自定义词库实现词库热更新。

==============================================================================

注意:默认情况下,最多一分钟之内就可以识别到新增的词语。

查看es-ik插件的源码可以发现

==============================================================================

Tags:

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表