solr6.0学习 - 走看看

zoukankan html css js c++ java

solr6.0学习

solr6.0学习（一）环境搭建
准备工作：
目前最新版本6.0。下载solr 6.0：Solr6.0下载
JDK8 下载jdk1.8：jdk1.8【solr6.0是基于jdk8开发的】
tomcat8.0 下载：tomcat8
##################################
在说明搭建环境之前，其实solr5.0之后 solr已经内置jetty服务器，可以自行启动。但是为了加入自己的特性，
以及在solr基础之上的应用，此文章主要针对发布在tomcat8上。
##################################
1、安装jdk8
2、下载solr6.0后，解压solr6.0的包。
3、解压tomcat8
4、将【solr-6.0.0serversolr-webapp】下的webapp文件拷贝到【apache-tomcat-8.0.33webapps】目录下，
并将webapp重命名为solr（可以重命名为取任意名称）。
solr文件目录如下：
5、将【solr-6.0.0serverlibext】下的所有jar包拷贝到【apache-tomcat-8.0.33webappssolrWEB-INFlib】
6、将【solr-6.0.0server esources】下的log4j.properties配置文件拷贝到【apache-tomcat-8.0.33webappssolrWEB-INFclasses】，如果WEB-INF下没有classes文件那么就创建一个classes文件夹。
7、在【apache-tomcat-8.0.33webappssolr】下新建一个文件【solrhome（文件夹名称可以任意命名）】，将【solr-6.0.0serversolr】下的所有文件拷贝到刚刚创建
的solrhome中。
8、修改【apache-tomcat-8.0.33webappssolrWEB-INF】下的web.xml，找到如下代码：
<env-entry>
<env-entry-name>solr/home</env-entry-name>
<env-entry-value>/put/your/solr/home/here</env-entry-value>
<env-entry-type>java.lang.String</env-entry-type>
</env-entry>
默认是注解掉，放开注解，并将<env-entry-value>中的值修改为刚刚步骤7中的solrhome目录，如：E:projectSearchapache-tomcat-8.0.33webappssolrsolrhome
9、运行tomcat，运行成功后访问：http://localhost:8080/solr/index.html 即可。

Solr 6.0 学习（二）创建core并插入索引
修改各种配置文件。

1、修改solrhome下的solr.xml文件

注解掉zookeeper搭建集群配置，我们后面会采用master-slave的形式。

至于zookeeper的形式可以阅读以下这篇文章【solrCloud集群配置指导】：http://www.aboutyun.com/thread-9432-1-1.html



2、在sorlhome文件夹下创建【my_solr】文件夹。

3、在【my_solr】文件夹中添加core.properties配置，内容如下：
name=my_solr
这个name的值实际上就core的名称，可以任意命名，为了保证统一和方便阅读，个人觉得最好和文件夹名称一致。
4、将【solr-6.0.0exampleexample-DIHsolrsolr】下的conf文件夹拷贝到【my_solr】文件夹下。包含如下文件：
5、solr-5.0 以上默认对schema的管理是使用managed-schema，不能手动修改，需要使用Schema Restful的API操作。

如果要想手动修改配置，把【conf】文件夹中managed-schema拷贝一份修改为schema.xml，在solrconfig.xml中修改如下
<codecFactory class="solr.SchemaCodecFactory"/>

<schemaFactory class="ClassicIndexSchemaFactory"/>

重启tomcat8，可能会报错，查看tomcat日志发现，比喻:

缺少DataImportHandler的jar等，那么将【solr-6.0.0dist】下的solr-dataimporthandler-6.0.0.jar和solr-dataimporthandler-extras-6.0.0.jar

拷贝到【apache-tomcat-8.0.33webappssolrWEB-INFlib】下。

重启tomcat8。如果缺少其他jar包，根据报错信息添加即可。没有异常，

访问：【http://localhost:8080/solr/index.html#/】
选择my_solr，会出现如下界面：
至此其实由于没有索引数据，其实solr是个空壳，那么下面写一个应用程序插入solr索引数据。

参考：http://www.open-open.com/lib/view/open1452062296995.html

1、首先需要修改schema.xml文件，添加
<field name="content_test" type="text_general" indexed="true" stored="true" multiValued="true"/>
field的属性和配置，可以google一下schema.xml 说明很多，用法也很多，这里就不赘述
2、添加索引数据，代码如下：

编写过程中可能会报错，最简便的方法是将web-inf下lib里所有jar包添加进来，然后运行，出什么错，就添加什么jar包4
------插入数据---------
package com.solr.insertData;

import java.io.IOException;
import java.util.ArrayList;
import java.util.List;

import org.apache.solr.client.solrj.SolrClient;
import org.apache.solr.client.solrj.SolrServerException;
import org.apache.solr.client.solrj.impl.HttpSolrClient;
import org.apache.solr.common.SolrInputDocument;

public class InsertProgarm {
//solr 服务器地址
public static final String solrServerUrl = "http://localhost:8080/solr";
//solrhome下的core
public static final String solrCroeHome = "my_solr";
//待索引、查询字段
public static String[] docs = {"Solr是一个独立的企业级搜索应用服务器",
"它对外提供类似于Web-service的API接口",
"用户可以通过http请求",
"向搜索引擎服务器提交一定格式的XML文件生成索引",
"也可以通过Http Get操作提出查找请求",
"并得到XML格式的返回结果"};
public static void main(String[] args) {
SolrClient client = getSolrClient();
int i=0;
List<SolrInputDocument> solrDocs = new ArrayList<SolrInputDocument>();
for (String content : docs) {
SolrInputDocument doc = new SolrInputDocument();
doc.addField("id", i++);
doc.addField("content_test", content);
solrDocs.add(doc);
}
try {
client.add(solrDocs);
client.commit();
} catch (SolrServerException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}

}
public static SolrClient getSolrClient(){
return new HttpSolrClient(solrServerUrl+"/"+solrCroeHome);
}

}
-------查询数据------------
package com.solr.insertData;

import java.io.IOException;
import java.util.List;

import org.apache.solr.client.solrj.SolrClient;
import org.apache.solr.client.solrj.SolrQuery;
import org.apache.solr.client.solrj.SolrServerException;
import org.apache.solr.client.solrj.impl.HttpSolrClient;
import org.apache.solr.client.solrj.response.QueryResponse;
import org.apache.solr.common.SolrDocument;
import org.apache.solr.common.SolrDocumentList;

public class SelectSolr {

public static void main(String[] args) throws SolrServerException, IOException {
String url = "http://localhost:8080/solr/my_solr";
//实例化一个solr
SolrClient solrClient = new HttpSolrClient(url);
//查询实现类
SolrQuery solrQuery = new SolrQuery();
//查询关键词 q 管家你字段
solrQuery.set("q", "id:2");
//过滤条件
//solrQuery.addFilterQuery("品牌");
//拿出response当中的数据结果集
QueryResponse response = solrClient.query(solrQuery);

SolrDocumentList results = response.getResults();
//结果集有多少条数据
long numFond = results.getNumFound();

System.out.println("数据条数："+numFond);

for(SolrDocument solrDocument:results){
String id = (String) solrDocument.get("id");
List<String> contentTest = (List) solrDocument.get("content_test");
System.out.println("id:"+id+"===content:"+contentTest);
}
}
}

---------------------------
3、运行成功后，会在【solrhome/my_solr】文件夹下创建一个【data】的文件夹，这个文件夹中的内容就是我们的solr索引。

其实其对于的是solconfig.xml中如下配置：

[html] view plain copy
在CODE上查看代码片派生到我的代码片


<dataDir>${solr.data.dir:}</dataDir>
4、访问http://localhost:8080/solr/index.html选择【my_solr】core，选择query得到如下界面：
选择【my_solr】core，选择query，点击【Execute Query】查询结果如下:
其实其访问的url实际为：http://localhost:8080/solr/my_solr/select?q=*%3A*&wt=json&indent=true
至于q、wt、indent等参数，代表的含义，可以搜索solr查询语法。
那么至此，我们就将solr插件完毕，结合了core和创建索引、查询程序，完成！
以上参考网址:http://blog.csdn.net/upxiaofeng/article/details/51426401
##############################################################################################三.配置中文分词器
(IK)
（1）将IKAnalyzer2012FF_u1.jar 复制到 D:JobsDBSolrsolr-Examplelib 目录以及Tomcat 6.0webappssolr-ExampleWEB-INFlib下面。

（2）在D:JobsDBSolrsolr-Example 下面创建目录classes，并将IKAnalyzer.cfg.xml 和 stopword.dic 复制到这个目录。

（3）配置之前从解压的Solr拷贝出来的solr文件夹下的配置文件。即D:JobsDBSolrsolr-Examplecollection1conf目录下面的schema.xml配置文件。

随便找一个fieldType配置项的后面，加入一个新的fieldType配置项。


<fieldType name="text_ik" class="solr.TextField">
<analyzer class="org.wltea.analyzer.lucene.IKAnalyzer">
</analyzer>
</fieldType>

查看全文

相关阅读:
python中scipy学习——随机稀疏矩阵及操作
 ptyhon中文本挖掘精简版
 ptyhon中文本挖掘精简版
 [python] 使用scikit-learn工具计算文本TF-IDF值
 [python] 使用scikit-learn工具计算文本TF-IDF值
 python高手的自修课
 python高手的自修课
 C/C++ scanf 函数中%s 和%c 的简单差别
 Ctags基本配置
 搭建gitserver

原文地址：https://www.cnblogs.com/shenlanzhizun/p/6079219.html