zoukankan      html  css  js  c++  java
  • 大数据应用技术课程实践--选题与实践方案

    一、选题与意义

    1.Hadoop平台应用

    2.Kaggle分析数据项目

    简要说明理由与意义。

    选择 1.Hadoop平台应用 --淘宝双11数据分析与预测

    通过Hadoop平台对淘宝的双十一数据进行分析,并预测出回头客,熟悉对于Hadoop平台更多的应用和操作。

    二、实践方案

    简要说明理由。

    步骤零:实验环境准备 整个实验的基础
    步骤一:本地数据集上传到数据仓库Hive 获取数据集
    步骤二:Hive数据分析 对数据集进行初步的理解分析
    步骤三:将数据从Hive导入到MySQL 导出数据,供预测使用
    步骤四:利用Spark预测回头客 利用数据进行预测
    步骤五:利用ECharts进行数据可视化分析 对结果进行可视化,更直观的感受

    三、实践任务分解

    根据所选的题目,明确实验步骤,分解任务到每天。

    四、实践计划

    按任务分解撰写计划表,每天按计划表开展工作。

    第天根据实际情况更新计划表,有必要时调整。

    1.

    大数据平台安装软件:

    链接:https://pan.baidu.com/s/1lZM6BkZ6XoRE3uwepsQ_5A
    提取码:ao1m

    虚拟机镜像文件:

    链接:https://pan.baidu.com/s/1e0qak_9Uymn_R1HmSu5ZLw  
    提取码:q0lt

  • 相关阅读:
    ::before和::after伪元素的用法
    JS中map、some、every、filter方法
    C++多线程,互斥,同步
    RAII
    Proxy 代理
    Decorator 装饰
    TCP和UDP的9个区别是什么
    谈谈自己对面向对象的理解
    C++11多线程
    std::move
  • 原文地址:https://www.cnblogs.com/a1120139442/p/13184015.html
Copyright © 2011-2022 走看看