网站首页 > 开源技术 正文
1:部署http服务
在这使用tomcat7作为web容器,先下载一个tomcat7,然后上传到某一台服务器上(192.168.80.100)。
再执行以下命令
tar -zxvf apache-tomcat-7.0.73.tar.gz
cd apache-tomcat-7.0.73/webapp/ROOT
vi hot.dic
验证一下这个文件是否可以正常访问
http://192.168.80.100:8080/hot.dic
2:修改ik插件的配置文件
cd elasticsearch-2.4.3/plugins/ik/config
vi IKAnalyzer.cfg.xml
修改key=remote_ext_dict 的entry 中的内容
3:验证
重启es,会看到如下日志信息,说明远程的词典加载成功了。
执行下面命令查看分词效果
正常情况下北京雾霾会分为多个词语,但是我们希望es把[北京雾霾]作为一个完整的词,又不希望重启es。
这样就需要修改前面的hot.dic文件,增加一个词语[北京雾霾]
vi hot.dic
文件保存之后,查看es的日志会看到如下日志信息
再执行下面命令查看分词效果
到这为止,可以实现动态添加自定义词库实现词库热更新。
==============================================================================
注意:默认情况下,最多一分钟之内就可以识别到新增的词语。
查看es-ik插件的源码可以发现
==============================================================================
猜你喜欢
- 2024-10-23 ES 基本知识(es基本介绍)
- 2024-10-23 maven打包jar包时如何打包本地jar文件
- 2024-10-23 记录自己搭建solr配置中文分词的过程供大家参考
- 2024-10-23 springboot整合websocket、solr(springboot整合rocketMQ)
- 2024-10-23 ElasticSearch安装ik分词插件(elasticsearch 安装ik分词器)
- 2024-10-23 12K的码农怎样蜕变为30k的架构师?找准方向,拒绝迷茫
- 2024-10-23 Lucene就是这么简单(好儿子今天妈妈就是你的女人了)
- 2024-10-23 5分钟带你了解Lucene全文索引(lucene索引原理)
- 2024-10-23 在.net core中进行中文分词方法(.net core hangfire)
- 2024-10-23 Elasticsearch-通过外网访问加入kibana,head「002」
你 发表评论:
欢迎- 最近发表
- 标签列表
-
- jdk (81)
- putty (66)
- rufus (78)
- 内网穿透 (89)
- okhttp (70)
- powertoys (74)
- windowsterminal (81)
- netcat (65)
- ghostscript (65)
- veracrypt (65)
- asp.netcore (70)
- wrk (67)
- aspose.words (80)
- itk (80)
- ajaxfileupload.js (66)
- sqlhelper (67)
- express.js (67)
- phpmailer (67)
- xjar (70)
- redisclient (78)
- wakeonlan (66)
- tinygo (85)
- startbbs (72)
- webftp (82)
- vsvim (79)
本文暂时没有评论,来添加一个吧(●'◡'●)