一:下载solr5.3安装包;点击 solr
二:安装
1:解压安装tomcat ,本文中使用 tomcat7.0
安装路径 :D:\tomcat\apache-tomcat-7.0.40
2:解压 安装 solr 5.3.1;
本文安装路径: D:\solr\solr-5.3.1
3:将 solr-5.3.1\server\solr-webapp 文件夹底下的 webapp 复制到 tomcat 对应目录底下的 webapps 中,并将文件夹名字改为 solr
本文路径:D:\tomcat\apache-tomcat-7.0.40\webapps\solr
4:将 solr-5.3.1\server\lib\ext 文件夹底下的lib全部复制到tomcat底下的 solr/WEB-INF/lib/ 中
本文路径:D:\tomcat\apache-tomcat-7.0.40\webapps\solr\WEB-INF\lib
5:将solr-5.3.1\server\resources 下的log4j.properties文件复制到tomcat/webapps/solr/WEB-INF/classes目录下,如果该目录不存在则新建。
6:将solr-5.3.1\server 下的 solr 文件夹复制到D:\tomcat\apache-tomcat-7.0.40\bin 目录下 , 这个就是 solr/home(存放的检索数据)
7:设置solr/home , 编辑 D:\tomcat\apache-tomcat-7.0.40\webapps\solr\WEB-INF\web.xml ;
solr 启动的时候会去这个目录下加载配置信息
<env-entry>
<env-entry-name>solr/home</env-entry-name>
<env-entry-value>D:/tomcat/apache-tomcat-7.0.40/bin/solr</env-entry-value>
<env-entry-type>java.lang.String</env-entry-type>
</env-entry>
三:启动tomcat http://localhost:9090/solr 查看是否配置成功
四: 添加自定义 solr
1: 在刚才 定义的 solr/ home 中 新建一个文件夹 core
如 本文路径:D:\tomcat\apache-tomcat-7.0.40\bin\solr\core
2:在core 目录下新建 data 文件夹 ,将 D:\tomcat\apache-tomcat-7.0.40\bin\solr\configsets\basic_configs 目录下的 conf 文件夹复制到 core 目录下
3:在sorl 控制台 点击 add core
五:配置中文分词(mmseg4j)
1:下载jar 包 (mmseg4j-core-1.10.0.jar、mmseg4j-solr-2.3.0.jar),并复制到tomcat底下的 solr/WEB-INF/lib/
这里包貌似不太好找,可以下载 solr-core 包,里面会包含这两个包
<dependency>
<groupId>org.apache.solr</groupId>
<artifactId>solr-core</artifactId>
<version>5.3.1</version>
</dependency>
2:D:\tomcat\apache-tomcat-7.0.40\bin\solr\core\conf\schema.xml 新增
<fieldtype name="textComplex" class="solr.TextField" positionIncrementGap="100">
<analyzer>
<tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="complex" dicPath="dic"/>
</analyzer>
</fieldtype>
<fieldtype name="textMaxWord" class="solr.TextField" positionIncrementGap="100">
<analyzer>
<tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="max-word" />
</analyzer>
</fieldtype>
<fieldtype name="textSimple" class="solr.TextField" positionIncrementGap="100">
<analyzer>
<tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="simple" dicPath="d:/my_dic" />
</analyzer>
</fieldtype>
六:java 中调用
1: 在上面说的schema.xml中,添加
<field name="content_test" type="textMaxWord" indexed="true" stored="true" multiValued="true"/>
2:新建测试类
// 需要导入 上文中的 solr-core 包即可
public class App
{
//solr url
public static final String URL = "http://127.0.0.1:9090/solr";
//solr应用
public static final String SERVER = "my_solr";
//待索引、查询字段
public static String[] docs = {"Solr是一个独立的企业级搜索应用服务器",
"用户可以通过http请求",
"向搜索引擎服务器提交一定格式的XML文件生成索引",
"也可以通过Http Get操作提出查找请求"};
public static SolrClient getSolrClient(){
return new HttpSolrClient(URL+"/"+SERVER);
}
/**
* 新建索引
*/
public static void ctIndex(){
SolrClient client = getSolrClient();
int i = 0;
List<SolrInputDocument> docList = new ArrayList<SolrInputDocument>();
for(String str : docs){
SolrInputDocument doc = new SolrInputDocument();
doc.addField("id",i++);
doc.addField("content_test", str);
docList.add(doc);
}
try {
client.add(docList);
client.commit();
} catch (SolrServerException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
};
/**
* 搜索
*/
public static void search(){
SolrClient client = getSolrClient();
SolrQuery query = new SolrQuery();
query.setQuery("content_test:搜索"); //搜索
QueryResponse response = null;
try {
response = client.query(query);
System.out.println(response.toString());
System.out.println();
SolrDocumentList docs = response.getResults();
System.out.println("文档个数:" + docs.getNumFound());
System.out.println("查询时间:" + response.getQTime());
for (SolrDocument doc : docs) {
System.out.println("id: " + doc.getFieldValue("id") + " content: " + doc.getFieldValue("content_test"));
}
} catch (SolrServerException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
}
public static void main(String[] args) {
ctIndex();
search();
}
}
3:查看执行结果
// 其中找到 带"搜索" 的 文档个数 2个
{responseHeader={status=0,QTime=7,params={q=content_test:搜索,wt=javabin,version=2}},response={numFound=2,start=0,docs=[SolrDocument{id=0, content_test=[Solr是一个独立的企业级搜索应用服务器], _version_=1538905774611234816}, SolrDocument{id=2, content_test=[向搜索引擎服务器提交一定格式的XML文件生成索引], _version_=1538905774615429120}]}}
文档个数:2
查询时间:7
id: 0 content: [Solr是一个独立的企业级搜索应用服务器]
id: 2 content: [向搜索引擎服务器提交一定格式的XML文件生成索引]
七: 与数据库整合
1: 以mysql作为示例。找到 D:\tomcat\apache-tomcat-7.0.40\bin\solr\core\conf\ solrconfig.xml 新增以下代码
// 特别注意 : 这里需要在 D:\tomcat\apache-tomcat-7.0.40\webapps\solr\WEB-INF\lib 下导入 solr-dataimporthandler-5.3.1.jar
<!--这个主要用来导入数据库 的配置文件-->
<requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler">
<lst name="defaults">
<str name="config">data-config.xml</str>
</lst>
</requestHandler>
2: 在D:\tomcat\apache-tomcat-7.0.40\bin\solr\core\conf 下新建 data-config.xml 文件
<?xml version="1.0" encoding="UTF-8" ?>
<dataConfig>
<!--这里配置自己的数据库信息-->
<dataSource name="solrDB" type="JdbcDataSource" driver="com.mysql.jdbc.Driver" url="jdbc:mysql://localhost:3306/demo" user="root" password="123456" batchSize="-1" />
<document>
<entity name="student" dataSource="solrDB" query="SELECT * from student">
<field column="stuId" name="id" />
<field column="stuName" name="stuName" />
<field column="age" name="age" />
<field column="sex" name="sex" />
</entity>
</document>
</dataConfig>
3: 修改 D:\tomcat\apache-tomcat-7.0.40\bin\solr\my_solr\conf\schema.xml ,新增如下代码
<!--这里的name 注意和上面的配置 对应-->
<field name="stuName" type="string" indexed="true" stored="true" multiValued="true"/>
<field name="age" type="int" indexed="true" stored="true" />
<field name="sex" type="string" indexed="true" stored="true" />
4:打开solr 控制台 ,点击左侧菜单“Dataimport“,默认勾选项即可,点击”Excute“按钮,这时会按照刚才的配置导入相应的数据到solr中 ,这里貌似不会自己刷新,你可以点击下面的 Refresh status 查看是否导入完成, 同时你也可以在 左侧导航栏, Logging 中查看导入日志
5:导入成功以后,可以点击左侧导航栏 Query ,在Q 栏中输入 字段 :值, 进行查询