Apache Solr solrconfig.xml 中文说明

zoukankan html css js c++ java

Apache Solr solrconfig.xml 中文说明
solrconfig.xml文件包含了大部分的参数用来配置Solr本身的。

Solrconfig.xml代码

dataDir parameter：<dataDir>/var/data/solr</dataDir>

用来指定一个替换原先在Solr目录下默认存放所有的索引数据，可以在Solr目录以外的任意目录中。如果复制使用后应该符合该参数。如果这个目录不是绝对路径的话，那么应该以当前的容器为相对路径。

mainIndex ：

这个参数的值用来控制合并多个索引段。

<useCompoundFile>：通过将很多 Lucene 内部文件整合到单一一个文件来减少使用中的文件的数量。这可有助于减少 Solr 使用的文件句柄数目，代价是降低了性能。除非是应用程序用完了文件句柄，否则 false 的默认值应该就已经足够。

mergeFactor：

决定低水平的 Lucene 段被合并的频率。较小的值（最小为 2）使用的内存较少但导致的索引时间也更慢。较大的值可使索引时间变快但会牺牲较多的内存。

maxBufferedDocs：

在合并内存中文档和创建新段之前，定义所需索引的最小文档数。段是用来存储索引信息的 Lucene 文件。较大的值可使索引时间变快但会牺牲较多的内存。

maxMergeDocs：

控制可由 Solr ,000) 最适合于具有合并的 Document 的最大数。较小的值 (< 10大量更新的应用程序。该参数不允许lucene在任何索引段里包含比这个值更多的文档，但是，多余的文档可以创建一个新的索引段进行替换。

maxFieldLength：

对于给定的 Document，控制可添加到 Field 的最大条目数，进而截断该文档。如果文档可能会很大，就需要增加这个数值。然而，若将这个值设置得过高会导致内存不足错误。

unlockOnStartup：

unlockOnStartup 告知 Solr 忽略在多线程环境中用来保护索引的锁定机制。在某些情况下，索引可能会由于不正确的关机或其他错误而一直处于锁定，这就妨碍了添加和更新。将其设置为 true 可以禁用启动锁定，进而允许进行添加和更新。

<mainIndex>

    

    <useCompoundFile>false</useCompoundFile>

    <mergeFactor>10</mergeFactor>

    <maxBufferedDocs>1000</maxBufferedDocs>

    <maxMergeDocs>2147483647</maxMergeDocs>

    <maxFieldLength>10000</maxFieldLength>

  </mainIndex>



updateHandler：

这个更新处理器主要涉及底层的关于如何更新处理内部的信息。（此参数不能跟高层次的配置参数Request Handlers对处理发自客户端的更新相混淆）。

<updateHandler class="solr.DirectUpdateHandler2">



    

缓冲更新这么多的数目，设置如下比较低的值，可以约束索引时候所用的内存

    <maxPendingDeletes>100000</maxPendingDeletes>

等待文档满足一定的标准后将自动提交，未来版本可以扩展现有的标准

    

    <autoCommit>

      <maxDocs>10000</maxDocs> 

触发自动提交前最多可以等待提交的文档数量

      <maxTime>86000</maxTime> 

在添加了一个文档之后，触发自动提交之前所最大的等待时间

    </autoCommit>



这个参数用来配置执行外部的命令。

一个postCommit的事件被触发当每一个提交之后

<listener event="postCommit" class="solr.RunExecutableListener">

      <str name="exe">snapshooter</str>

      <str name="dir">solr/bin</str>

      <bool name="wait">true</bool>

      

    </listener>

exe--可执行的文件类型

dir--可以用该目录做为当前的工作目录。默认为"."

wait--调用线程要等到可执行的返回值

args--传递给程序的参数默认nothing

env--环境变量的设置默认nothing



<query>

    

    <maxBooleanClauses>1024</maxBooleanClauses>



<query>:

控制跟查询相关的一切东东。



Caching：修改这个参数可以做为索引的增长和变化。





    <filterCache

      class="solr.LRUCache"

      size="512"

      initialSize="512"

      autowarmCount="256"/>



   

查询结果缓存

    <queryResultCache

      class="solr.LRUCache"

      size="512"

      initialSize="512"

      autowarmCount="256"/>



  

由于Lucene的内部文档ID标识（文档名称）是短暂的，所以这种缓存不会被自动warmed。

    <documentCache

      class="solr.LRUCache"

      size="512"

      initialSize="512"

      autowarmCount="0"/>



    

这么做的的关键就是应该明确规定实现solr.search.CacheRegenerator接口如果autowarming是比较理想化的设置。

    



    

    <useFilterForSortedQuery>true</useFilterForSortedQuery>



    



一种优化用于queryResultCache，当一个搜索被请求，也会收集一定数量的文档ID做为一个超集。举个例子，一个特定的查询请求匹配的文档是10到19，此时，queryWindowSize是50，这样，文档从0到50都会被收集并缓存。这样，任何更多的在这个范围内的请求都会通过缓存来满足查询。

    <queryResultWindowSize>50</queryResultWindowSize>



    

    <HashDocSet maxSize="3000" loadFactor="0.75"/>





    

    <boolTofilterOptimizer enabled="true" cacheSize="32" threshold=".05"/>



    

    <enableLazyFieldLoading>false</enableLazyFieldLoading>

另一Xml代码
1. <?xml version="1.0" encoding="UTF-8" ?>
2. 
19. 
32. <schema name="musicbrainz" version="1.1">
33. 
40. <types>
41. 
49. 
66. <fieldType name="string" class="solr.StrField" sortMissingLast="true" omitNorms="true"/>
68. 
69. <fieldType name="boolean" class="solr.BoolField" sortMissingLast="true" omitNorms="true"/>
71. 
85. 
88. <fieldType name="integer" class="solr.IntField" omitNorms="true"/>
89. <fieldType name="long" class="solr.LongField" omitNorms="true"/>
90. <fieldType name="float" class="solr.FloatField" omitNorms="true"/>
91. <fieldType name="double" class="solr.DoubleField" omitNorms="true"/>
94. 
98. <fieldType name="sint" class="solr.SortableIntField" sortMissingLast="true" omitNorms="true"/>
99. <fieldType name="slong" class="solr.SortableLongField" sortMissingLast="true" omitNorms="true"/>
100. <fieldType name="sfloat" class="solr.SortableFloatField" sortMissingLast="true" omitNorms="true"/>
101. <fieldType name="sdouble" class="solr.SortableDoubleField" sortMissingLast="true" omitNorms="true"/>
104. 
124. <fieldType name="date" class="solr.DateField" sortMissingLast="true" omitNorms="true"/>
127. 
138. <fieldType name="random" class="solr.RandomSortField" indexed="true" />
140. 
152. 
159. 
160. <fieldType name="text_ws" class="solr.TextField" positionIncrementGap="100">
161. <analyzer>
162. <tokenizer class="solr.WhitespaceTokenizerFactory"/>
163. </analyzer>
164. </fieldType>
166. 
173. <fieldType name="text" class="solr.TextField" positionIncrementGap="100">
174. <analyzer type="index">
175. <tokenizer class="solr.WhitespaceTokenizerFactory"/>
176. 
179. 
183. <filter class="solr.StopFilterFactory"
184. ignoreCase="true"
185. words="stopwords.txt"
186. enablePositionIncrements="true"
187. />
188. <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="1" catenateNumbers="1" catenateAll="0" splitOnCaseChange="1"/>
189. <filter class="solr.LowerCaseFilterFactory"/>
190. <filter class="solr.EnglishPorterFilterFactory" protected="protwords.txt"/>
191. <filter class="solr.RemoveDuplicatesTokenFilterFactory"/>
192. </analyzer>
193. <analyzer type="query">
194. <tokenizer class="solr.WhitespaceTokenizerFactory"/>
195. <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>
196. <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt"/>
197. <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="0" catenateNumbers="0" catenateAll="0" splitOnCaseChange="1"/>
198. <filter class="solr.LowerCaseFilterFactory"/>
199. <filter class="solr.EnglishPorterFilterFactory" protected="protwords.txt"/>
200. <filter class="solr.RemoveDuplicatesTokenFilterFactory"/>
201. </analyzer>
202. </fieldType>
205. 
207. <fieldType name="textTight" class="solr.TextField" positionIncrementGap="100" >
208. <analyzer>
209. <tokenizer class="solr.WhitespaceTokenizerFactory"/>
210. <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="false"/>
211. <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt"/>
212. <filter class="solr.WordDelimiterFilterFactory" generateWordParts="0" generateNumberParts="0" catenateWords="1" catenateNumbers="1" catenateAll="0"/>
213. <filter class="solr.LowerCaseFilterFactory"/>
214. <filter class="solr.EnglishPorterFilterFactory" protected="protwords.txt"/>
215. <filter class="solr.RemoveDuplicatesTokenFilterFactory"/>
216. </analyzer>
217. </fieldType>
219. 
220. <fieldType name="title" class="solr.TextField" positionIncrementGap="100" >
221. <analyzer>
222. <tokenizer class="solr.WhitespaceTokenizerFactory"/>
223. 
224. <filter class="solr.WordDelimiterFilterFactory" generateWordParts="0" generateNumberParts="0" catenateWords="1" catenateNumbers="1" catenateAll="0"/>
225. <filter class="solr.LowerCaseFilterFactory"/>
226. 
227. <filter class="solr.RemoveDuplicatesTokenFilterFactory"/>
228. </analyzer>
229. </fieldType>
231. 
243. <fieldType name="textSpell" class="solr.TextField" positionIncrementGap="100" stored="false" multiValued="true">
244. <analyzer type="index">
245. <tokenizer class="solr.StandardTokenizerFactory"/>
246. <filter class="solr.LowerCaseFilterFactory"/>
247. <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>
248. <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt"/>
249. <filter class="solr.StandardFilterFactory"/>
250. <filter class="solr.RemoveDuplicatesTokenFilterFactory"/>
251. </analyzer>
252. <analyzer type="query">
253. <tokenizer class="solr.StandardTokenizerFactory"/>
254. <filter class="solr.LowerCaseFilterFactory"/>
255. <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt"/>
256. <filter class="solr.StandardFilterFactory"/>
257. <filter class="solr.RemoveDuplicatesTokenFilterFactory"/>
258. </analyzer>
259. </fieldType>
260. 
261. <fieldType name="textSpellPhrase" class="solr.TextField" positionIncrementGap="100" stored="false" multiValued="true">
262. <analyzer>
263. <tokenizer class="solr.KeywordTokenizerFactory"/>
264. <filter class="solr.LowerCaseFilterFactory"/>
265. </analyzer>
266. </fieldType>
268. 
272. <fieldType name="alphaOnlySort" class="solr.TextField" sortMissingLast="true" omitNorms="true">
273. <analyzer>
274. 
277. <tokenizer class="solr.KeywordTokenizerFactory"/>
278. 
281. <filter class="solr.LowerCaseFilterFactory" />
282. 
283. <filter class="solr.TrimFilterFactory" />
284. 
295. <filter class="solr.PatternReplaceFilterFactory"
296. pattern="([^a-z])" replacement="" replace="all"
297. />
298. </analyzer>
299. </fieldType>
301. <fieldType name="rType" class="solr.TextField" sortMissingLast="true" omitNorms="true">
302. <analyzer>
303. <tokenizer class="solr.KeywordTokenizerFactory"/>
304. <filter class="solr.PatternReplaceFilterFactory"
305. pattern="^(0|1\d\d)$" replacement="" replace="first" />
306. <filter class="solr.LengthFilterFactory" min="1" max="100" />
307. <filter class="solr.SynonymFilterFactory" synonyms="mb_attributes.txt" ignoreCase="false" expand="false"/>
308. </analyzer>
309. </fieldType>
311. <fieldType name="rOfficial" class="solr.TextField" sortMissingLast="true" omitNorms="true">
312. <analyzer>
313. <tokenizer class="solr.KeywordTokenizerFactory"/>
314. <filter class="solr.PatternReplaceFilterFactory"
315. pattern="^(0|\d\d?)$" replacement="" replace="first" />
316. <filter class="solr.LengthFilterFactory" min="1" max="100" />
317. <filter class="solr.SynonymFilterFactory" synonyms="mb_attributes.txt" ignoreCase="false" expand="false"/>
318. </analyzer>
319. </fieldType>
321. <fieldType name="bucketFirstLetter" class="solr.TextField" sortMissingLast="true" omitNorms="true">
322. <analyzer type="index">
323. <tokenizer class="solr.PatternTokenizerFactory" pattern="^([a-zA-Z]).*" group="1" />
324. <filter class="solr.SynonymFilterFactory" synonyms="mb_letterBuckets.txt" ignoreCase="true" expand="false"/>
325. </analyzer>
326. <analyzer type="query">
327. <tokenizer class="solr.KeywordTokenizerFactory"/>
328. </analyzer>
329. </fieldType>
331. 
334. <fieldtype name="ignored" stored="false" indexed="false" class="solr.StrField" />
336. </types>
339. <fields>
340. 
362. <field name="id" type="string" required="true" />
364. <field name="type" type="string" required="true" />
366. 
368. <field name="a_name" type="title" />
369. <field name="a_name_sort" type="string" stored="false" />
370. <field name="a_alias" type="title" stored="false" multiValued="true" />
371. <field name="a_type" type="string" />
372. <field name="a_begin_date" type="date" />
373. <field name="a_end_date" type="date" />
374. <field name="a_member_name" type="title" multiValued="true" />
375. <field name="a_member_id" type="title" multiValued="true" />
376. <field name="a_release_date_latest" type="date" />
378. 
379. <field name="a_spell" type="textSpell" />
380. <field name="a_spellPhrase" type="textSpellPhrase" />
382. 
384. <field name="r_name" type="title" />
385. <field name="r_name_sort" type="alphaOnlySort" stored="false"/>
386. <field name="r_name_facetLetter" type="bucketFirstLetter" stored="false" />
388. <field name="r_a_name" type="title" />
389. <field name="r_a_id" type="string" />
390. 
391. 
392. <field name="r_attributes" type="integer" multiValued="true" indexed="false" />
393. <field name="r_type" type="rType" multiValued="true" stored="false"/>
394. <field name="r_official" type="rOfficial" multiValued="true" stored="false"/>
396. <field name="r_lang" type="string" indexed="false" /> 
397. <field name="r_tracks" type="sint" indexed="false" />
398. <field name="r_event_country" type="string" multiValued="true" />
399. <field name="r_event_date" type="date" multiValued="true" />
400. <field name="r_event_date_earliest" type="date" multiValued="false" />
402. 
404. <field name="l_name" type="title" />
405. <field name="l_name_sort" type="string" stored="false" />
406. <field name="l_type" type="string" />
407. <field name="l_begin_date" type="date" />
408. <field name="l_end_date" type="date" />
410. 
412. <field name="t_name" type="title" />
413. <field name="t_duration" type="sint"/>
414. <field name="t_a_id" type="string" />
415. <field name="t_a_name" type="title" />
416. <field name="t_num" type="integer" indexed="false" />
417. <field name="t_r_id" type="string" />
418. <field name="t_r_name" type="title" />
419. <field name="t_r_attributes" multiValued="true" type="integer" />
420. <field name="t_r_tracks" type="sint" />
421. <field name="t_trm_lookups" type="sint" />
423. 
424. <field name="word" type="ignored" />
425. <field name="includes" type="ignored" />
427. </fields>
429. 
433. <uniqueKey>id</uniqueKey>
435. 
440. <defaultSearchField>a_name</defaultSearchField>
442. 
443. 
445. 
448. <copyField source="a_name" dest="a_spell" />
449. <copyField source="a_alias" dest="a_spell" />
450. <copyField source="a_name" dest="a_spellPhrase" />
451. <copyField source="a_alias" dest="a_spellPhrase" />
453. <copyField source="r_name" dest="r_name_sort" />
454. <copyField source="r_name" dest="r_name_facetLetter" />
455. <copyField source="r_attributes" dest="r_type" />
456. <copyField source="r_attributes" dest="r_official" />
460. 
463. 
464. 
468. 
474. </schema>
博客地址：【爱开卷360】http://www.cnblogs.com/ibook360
查看全文

相关阅读:
Java斗地主--001版本
 集合----方法的可变参数
 浅谈--Java编译期异常+运行期异常
 JavaSE编程基础（一）
JavaSE编程基础（三）
JavaSE编程基础（二）
软件测试（三十）
软件测试（二十九）
软件测试（二十七）
软件测试（二十八）

原文地址：https://www.cnblogs.com/ibook360/p/2232875.html

最新文章
数据结构面试
 Linux基础
 正则化
 机器学习基础
 request.getRequestURI().indexOf是什么意思
 过滤器概述
 JSP标签技术
 JSP介绍
 session
cookie的API