zoukankan      html  css  js  c++  java
  • Python-将json文件写入ES数据库

    1、安装Elasticsearch数据库

    PS:在此之前需首先安装Java SE环境

    下载elasticsearch-6.5.2版本,进入/elasticsearch-6.5.2/bin目录,双击执行elasticsearch.bat 打开浏览器输入http://localhost:9200 显示以下内容则说明安装成功

     

    安装head插件,便于查看管理(还可以用kibana)

    首先安装Nodejs(下载地址https://nodejs.org/en/

    再下载 elasticsearch-head-master包解压到/elasticsearch-6.5.2/下(链接:https://pan.baidu.com/s/1oX9wKuAYrvY2ZRBT0cos6A 
    提取码:5ik4)

    修改配置文件elasticsearch-6.5.2configelasticsearch.yml如下:

     

    进入elasticsearch-head-master目录下执行 npm install -g grunt-cli再执行npm install 安装依赖

    在elasticsearch-head-master目录下找到Gruntfile.js文件修改服务器监听地址如下:

     

    执行grunt server命令启动head服务

     

    访问地址http://localhost:9100/即可访问head管理页面

    2、将json文件写入ES数据库(py脚本如下)

    # -*- coding: UTF-8 -*-
    
    from itertools import islice
    import json , sys
    from elasticsearch import Elasticsearch , helpers
    import threading
    
    _index = 'indextest'   #修改为索引名
    _type = 'string'     #修改为类型名
    es_url = 'http://192.168.116.1:9200/'  #修改为elasticsearch服务器
    
    reload(sys)
    sys.setdefaultencoding('utf-8')
    es = Elasticsearch(es_url)
    es.indices.create(index=_index, ignore=400)
    chunk_len = 10
    num = 0
    
    def bulk_es(chunk_data):
        bulks=[]
        try:
            for i in xrange(chunk_len):
                bulks.append({
                        "_index": _index,
                        "_type": _type,
                        "_source": chunk_data[i]
                    })
            helpers.bulk(es, bulks)
        except:
            pass
    
    with open(sys.argv[1]) as f:
        while True:
            lines = list(islice(f, chunk_len))
            num =num +chunk_len
            sys.stdout.write('
    ' + 'num:'+'%d' % num)
            sys.stdout.flush()
            bulk_es(lines)
            if not lines:
                print "
    "
                print "task has finished"
                break
  • 相关阅读:
    Git 总结
    .net报错大全
    对于堆和栈的理解
    html 局部打印
    c#面试问题总结
    算法题总结
    h5-plus.webview
    堆和栈,引用类型,值类型,指令,指针
    .NET framework具体解释
    前端之间的url 传值
  • 原文地址:https://www.cnblogs.com/poziiey/p/10677946.html
Copyright © 2011-2022 走看看