通过测试发现用SimplePostTool与solr界面dataimport索引数据的结果有如下区别:
1、SimplePostTool索引数据对结构化数据文件索引比较合适,比如csv/json/xml(必须符合一定的格式的xml格式才行)等。但是如果文档中中文数据,那么文档必须以utf-8来进行保存,否则索引数据后会有乱码。
对非结构化数据文件索引无法搜索。
2、solr界面dataimport索引数据不关心文档的保存格式,但是索引的结果都是把文档的数据都索引到一个字段中比如text,这样对结构化数据索引不合适,对非结构化数据索引合适,比如office文档,txt,pdf,html等文档
具体的索引请参考:
Solr6.6.0 用 SimplePostTool索引文件的启示 和