zoukankan      html  css  js  c++  java
  • 小特工具箱新增模块:大数据分析工具

    小特工具箱又新增一个功能:大数据分析工具,界面如下图所示。基于DevExpress组件中的PivotGridControl控件,以前没注意到这个控件,最近才开始使用,发现确实挺好用。做一般的数据分析,够用了。

    图片

    我们以分析豆瓣电影评论为例,春节档电影最大黑马要数贾玲的《你好,李焕英》,我们通过抓取能够得到这部电影的豆瓣电影评论,保存成JSON。因为这个工具目前是单表操作,所有我们要额外加工下,把评论时间拆分下,分成评论日期和评论小时,还要再加一个聚合字段(相当于销售订单中的发货数量,用于统计)。至此,要分析的数据我们就准备好了。

    图片

    下面打开这个模块,将生成好的JSON文件复制至文本框,点击按钮:加载数据。之后会切换到基础数据面板,可以直接生成DataTable数据和解析出栏目列。

    图片

    右侧可以选择BI分析时的列,比如我们只统计电影评论的每天有多少条,每小时有多少条。我们就可以选择这3列,注意:数据类型需改为Int型,不然是无法统计的。

    设置完这些后,点击按钮:智能分析,就会切换到最后一个面板。它的栏目有这些类型,即可做为行,也可作为列。怎么折腾都行,你高兴就好。

    图片

    最后补充下,这个工具的数据源,支持这些

    JSON字符串和文件,要求List结构

    Excel文件,首个Sheet页数据

    SQL语句,需连接数据库

    DataTable(转成DataSet再WriteXml即可)

    本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利.
  • 相关阅读:
    sys_refcursor vs ref cursor in oracle
    Oracle-cursor动态游标
    游标(cursor)--显式游标&隐式游标、游标四个属性、循环遍历
    PL/SQL IF CASE
    python字符串的encode和decode
    python中raw_input()与input()
    Emacs显示行号
    Python爬虫——抓取糗百段子
    Python代码一定要对齐
    Python标准库内置函数——hasattr
  • 原文地址:https://www.cnblogs.com/xiyang1011/p/14503673.html
Copyright © 2011-2022 走看看