zoukankan html css js c++ java

在SolrNet中使用Apache Tika抽取文件元数据

1.添加jar文件：

tika-core-0.10.jar

tika-parsers-0.10.jar

.....

2.修改solrconfig.xml，修改完成后重启solr实例：

  <lib dir="solr路径/dist/" regex="apache-solr-cell-\d.*\.jar" />
  <lib dir="solr路径/contrib/extraction/lib" regex=".*\.jar" />

  <requestHandler name="/update/extract" class="org.apache.solr.handler.extraction.ExtractingRequestHandler">
    <lst name="defaults">
      <str name="map.Last-Modified">last_modified</str>
      <str name="uprefix">metadata_</str>
    </lst>
  </requestHandler>

3.c#调用代码：

var solr = ServiceLocator.Current.GetInstance<ISolrOperations<IndexDocument>>();

private void AddFile(ISolrOperations<IndexDocument> solr, string id, byte[] content, string resourceName)
{
    using (MemoryStream stream = new MemoryStream(content))
    {
        var response = solr.Extract(new ExtractParameters(stream, id, resourceName)
        {
            ExtractFormat = ExtractFormat.Text,
            ExtractOnly = false,
            Fields = new[] 
            { 
                new ExtractField("name1", "value1"), 
                new ExtractField("name2", "value2")
            }
        });
        Console.WriteLine(response.Content);
    }
}

作者：协思
出处：http://zeeman.cnblogs.com/
QQ交流群：32972862

查看全文

相关阅读:
Go语言函数之可变参数
 Python 调用系统命令的模块 Subprocess
python关闭socket端口立即释放
 Python面试题（四）
Project简介
 Office Visio简介
 [转载]Windows 2012 R2安装SharePoint 2013 手动安装工具软件
 [转载]SharePoint 2013测试环境安装配置指南
 [转载]SharePoint 2013 解决方案中使用JavaScript
[转载]我们可以用SharePoint做什么

原文地址：https://www.cnblogs.com/zeeman/p/2824640.html