zoukankan      html  css  js  c++  java
  • 关于Lucene.Net 2.3.1 索引时抛出System.IndexOutOfRangeException异常

    一、异常情形

    IndexWriter writer = new IndexWriter("D:\\index"new StandardAnalyzer(),true);
    writer.SetMaxBufferedDocs(
    1000000);
    writer.SetMergeFactor(
    1000);
    for (int i = 0; i < 1000000; i++) {
        AddDocument(writer, 
    "测试标题""测试内容");
    }

    static void AddDocument(IndexWriter writer, string title, string content) {
        Document document 
    = new Document();
        document.Add(
    new Field("title", title, Field.Store.YES, Field.Index.TOKENIZED));
        document.Add(
    new Field("content", content, Field.Store.YES, Field.Index.TOKENIZED));
        writer.AddDocument(document);
    }

    使用以上代码进行索引时会抛出“System.IndexOutOfRangeException,索引超出了数组界限。”异常。抛出异常的代码在DocumentWriter 3543行左右。

    int level = slice[upto] & 15;
    int newLevel = Lucene.Net.Index.DocumentsWriter.nextLevelArray[level];
    int newSize = Lucene.Net.Index.DocumentsWriter.levelSizeArray[newLevel];
    int newLevel = Lucene.Net.Index.DocumentsWriter.nextLevelArray[level];语句nextLevelArray数组的索引有效范围是0~9,当出现10以上时会报该错误。详细原因还未找出,据我推测这是从Java版本翻译过来造成的情况。
    这里的slice参数传递进来时byte类型的数组,从数组中取值,取出的值范围在0~255,和15做与运算,还是能够大于9。这是Java与.net的差异造成的。Java中的byte范围是-128~127,也就是说Java中的byte类型是有符号的,而.net中的byte类型是无符号的。java中的byte应该与.net中的sbyte相对应。Java代码原本限制出现该错误的逻辑,移植到.net版本可能会无效。这里就造成了引发这个异常的原因。
    以上属个人推测。
    二、解决办法
    暂时没有太好的办法能够解决这个问题。
    1、在Lucene 2.4版本中DocumentWriter已经进行了大改造,再翻译过来可能不会有这种问题。但是等.net版本更新到那个版本估计还要很长时间。
    2、还有就是把现在使用的2.3.1版降低到2.1版。
    3、经实验表明,writer.SetMaxBufferedDocs(1000000);这个数字小于10000时,也不会引发这个错误。
  • 相关阅读:
    ASP.NET WebAPI2 发布之后404 Not Found
    WPF MVVM TreeView 实现 右键选中 右键菜单
    Asp.Net MVC4+EF6 Code First 权限管理系统 源码下载
    C# Winform DataGrid 绑定List<> Or ObservableCollection<> 类型无法自动刷新问题
    VMWare 安装时报错 tools-windows.msi failed报错解决办法
    HashMap 扩容机制
    POI解析Excel封装工具
    poi API
    简单echars说明和使用
    比较运算符compareTo()、equals()、==之间的区别
  • 原文地址:https://www.cnblogs.com/birdshover/p/1391453.html
Copyright © 2011-2022 走看看