zoukankan      html  css  js  c++  java
  • Nutch2.3分布执行过程中Mongodb中数据的变化

    inject

    $ nutch inject /opt/nutch/runtime/local/urls/

    > db.stats()

    {

            "db" : "nutch",

            "collections" : 3,

            "objects" : 11,

            "avgObjSize" : 176,

            "dataSize" : 1936,

            "storageSize" : 24576,

            "numExtents" : 3,

            "indexes" : 1,

            "indexSize" : 8176,

            "fileSize" : 16777216,

            "nsSizeMB" : 16,

            "dataFileVersion" : {

                    "major" : 4,

                    "minor" : 5

            },

            "extentFreeList" : {

                    "num" : 0,

                    "totalSize" : 0

            },

            "ok" : 1

    }

    generate

    $ nutch generate -topN 10

    > db.stats()

    {

            "db" : "nutch",

            "collections" : 3,

            "objects" : 11,

            "avgObjSize" : 315.6363636363636,

            "dataSize" : 3472,

            "storageSize" : 24576,

            "numExtents" : 3,

            "indexes" : 1,

            "indexSize" : 8176,

            "fileSize" : 16777216,

            "nsSizeMB" : 16,

            "dataFileVersion" : {

                    "major" : 4,

                    "minor" : 5

            },

            "extentFreeList" : {

                    "num" : 0,

                    "totalSize" : 0

            },

            "ok" : 1

    }

    fetch

    $ nutch fetch -all -threads 30

    > db.stats()

    {

            "db" : "nutch",

            "collections" : 3,

            "objects" : 11,

            "avgObjSize" : 6536.727272727273,

            "dataSize" : 71904,

            "storageSize" : 1073152,

            "numExtents" : 4,

            "indexes" : 1,

            "indexSize" : 8176,

            "fileSize" : 16777216,

            "nsSizeMB" : 16,

            "dataFileVersion" : {

                    "major" : 4,

                    "minor" : 5

            },

            "extentFreeList" : {

                    "num" : 0,

                    "totalSize" : 0

            },

            "ok" : 1

    }


    parse

    $ nutch parse -all

    > db.stats()

    {

            "db" : "nutch",

            "collections" : 3,

            "objects" : 11,

            "avgObjSize" : 6536.727272727273,

            "dataSize" : 71904,

            "storageSize" : 1073152,

            "numExtents" : 4,

            "indexes" : 1,

            "indexSize" : 8176,

            "fileSize" : 16777216,

            "nsSizeMB" : 16,

            "dataFileVersion" : {

                    "major" : 4,

                    "minor" : 5

            },

            "extentFreeList" : {

                    "num" : 0,

                    "totalSize" : 0

            },

            "ok" : 1

    }

    updatedb

    $ nutch update -all

    > db.stats()

    {

            "db" : "nutch",

            "collections" : 3,

            "objects" : 89,

            "avgObjSize" : 1233.9775280898875,

            "dataSize" : 109824,

            "storageSize" : 1073152,

            "numExtents" : 4,

            "indexes" : 1,

            "indexSize" : 8176,

            "fileSize" : 16777216,

            "nsSizeMB" : 16,

            "dataFileVersion" : {

                    "major" : 4,

                    "minor" : 5

            },

            "extentFreeList" : {

                    "num" : 0,

                    "totalSize" : 0

            },

            "ok" : 1

    }

    index

    $ nutch index -all

    > db.stats()

    {

            "db" : "nutch",

            "collections" : 3,

            "objects" : 89,

            "avgObjSize" : 1233.9775280898875,

            "dataSize" : 109824,

            "storageSize" : 1073152,

            "numExtents" : 4,

            "indexes" : 1,

            "indexSize" : 8176,

            "fileSize" : 16777216,

            "nsSizeMB" : 16,

            "dataFileVersion" : {

                    "major" : 4,

                    "minor" : 5

            },

            "extentFreeList" : {

                    "num" : 0,

                    "totalSize" : 0

            },

            "ok" : 1

    }

  • 相关阅读:
    Bootstrap Table
    XML CDATA识别“<,>”
    LigerUI之Grid使用详解(一)——显示数据 --分页
    Oracle中对XMLType的简单操作(extract、extractvalue...)
    Qt实现应用程序单实例运行--LocalServer方式
    Live m3u8播放3个文件自动停止问题
    markdown
    node.js 知识记录
    .NET 高级架构师 WEB架构师 ------时间 总结 专注
    .NET 高级架构师 WEB架构师 ------走正确的路
  • 原文地址:https://www.cnblogs.com/zhjsll/p/4704338.html
Copyright © 2011-2022 走看看