ASP源码.NET源码PHP源码JSP源码JAVA源码DELPHI源码PB源码VC源码VB源码Android源码
当前位置:首页 >> 数据库 >> 其他数据库 >> IK中文分词器配置txt

IK中文分词器配置txt

来源:网络整理     时间:2018-08-29     关键词:

本篇文章主要介绍了" IK中文分词器配置txt",主要涉及到方面的内容,对于其他数据库感兴趣的同学可以参考一下: 准备工作:1、适合solr5.5.5版本的ik分词器(solr5.5.5基于lucene5.5.5,此处选用如下:http://files.cnblogs.co...

准备工作:

1、适合solr5.5.5版本的ik分词器(solr5.5.5基于lucene5.5.5,此处选用如下:http://files.cnblogs.com/files/zhangweizhong/ikanalyzer-solr5.zip)

操作步骤:

1、解压ikanalyzer-solr5.zip,上传ik-analyzer-solr5-5.x.jar至tomcat下的solr项目中的webapps/solr/WEB-INF/lib目录

2、将扩展词典(ext.dic和stopword.dic)、配置文件(IKAnalyzer.cfg.xml)放至tomcat下的solr项目中的webapps/solr/WEB-INF/classes目录

3、在需要增加分词器的core中增加配置,修改managed-schema(schema.xml)文件,增加fieldType:

<fieldType name="text_ik">   

<analyzer type="index" isMaxWordLength="false"/>   

<analyzer type="query" isMaxWordLength="true"/>   

</fieldType>

4、为需要使用分词器的字段增加配置:

<field name="name" type="text_ik" indexed="true" stored="true" required="true" multiValued="false" />

5、重启,通过管控台的analysis功能选择‘text_ik’的fieldType进行测试,结果如下:



注意事项:

1、如果之前已经创建了索引,需要将之前的索引删掉,重新创建分词后的索引。

2、ik-analyzer-solr5-5.x.jar必须使用jdk1.8,如果当前环境为jdk1.7,可下载附件中的ik-analyzer-solr5-5.x.jar作为替代

以上就介绍了 IK中文分词器配置txt,包括了方面的内容,希望对其他数据库有兴趣的朋友有所帮助。

本文网址链接:http://www.codes51.com/article/detail_4587332.html

相关图片

相关文章