zoukankan      html  css  js  c++  java
  • 04.网站点击流数据分析项目_模块开发_数据仓库设计

    注:采用星型模型                                            

    5.1 事实表

    原始数据表:t_origin_weblog

    valid

    string

    是否有效

    remote_addr

    string

    访客ip

    remote_user

    string

    访客用户信息

    time_local

    string

    请求时间

    request

    string

    请求url

    status

    string

    响应码

    body_bytes_sent

    string

    响应字节数

    http_referer

    string

    来源url

    http_user_agent

    string

    访客终端信息

    ETL中间表:t_etl_referurl

    valid

    string

    是否有效

    remote_addr

    string

    访客ip

    remote_user

    string

    访客用户信息

    time_local

    string

    请求时间

    request

    string

    请求url

    request_host

    string

    请求的域名

    status

    string

    响应码

    body_bytes_sent

    string

    响应字节数

    http_referer

    string

    来源url

    http_user_agent

    string

    访客终端信息

    valid

    string

    是否有效

    remote_addr

    string

    访客ip

    remote_user

    string

    访客用户信息

    time_local

    string

    请求时间

    request

    string

    请求url

    status

    string

    响应码

    body_bytes_sent

    string

    响应字节数

    http_referer

    string

    外链url

    http_user_agent

    string

    访客终端信息

    host

    string

    外链url的域名

    path

    string

    外链url的路径

    query

    string

    外链url的参数

    query_id

    string

    外链url的参数值

    访问日志明细宽表:t_ods_access_detail

    valid

    string

    是否有效

    remote_addr

    string

    访客ip

    remote_user

    string

    访客用户信息

    time_local

    string

    请求时间

    request

    string

    请求url整串

    request_level1

    string

    请求的一级栏目

    request_level2

    string

    请求的二级栏目

    request_level3

    string

    请求的三级栏目

    status

    string

    响应码

    body_bytes_sent

    string

    响应字节数

    http_referer

    string

    来源url

    http_user_agent

    string

    访客终端信息

    valid

    string

    是否有效

    remote_addr

    string

    访客ip

    remote_user

    string

    访客用户信息

    time_local

    string

    请求时间

    request

    string

    请求url

    status

    string

    响应码

    body_bytes_sent

    string

    响应字节数

    http_referer

    string

    外链url

    http_user_agent

    string

    访客终端信息整串

    http_user_agent_browser

    string

    访客终端浏览器

    http_user_agent_sys

    string

    访客终端操作系统

    http_user_agent_dev

    string

    访客终端设备

    host

    string

    外链url的域名

    path

    string

    外链url的路径

    query

    string

    外链url的参数

    query_id

    string

    外链url的参数值

    daystr

    string

    日期整串

    tmstr

    string

    时间整串

    month

    string

    月份

    day

    string

    hour

    string

    minute

    string

    ##

    ##

    ##

    mm

    string

    分区字段--月

    dd

    string

    分区字段--日

    5.2 维度表

    时间维度 v_year_month_date

    year

    month

    day

    hour

    minute

    访客地域维度t_dim_area

    北京

    上海

    广州

    深圳

    河北

    河南

    终端类型维度t_dim_termination

    uc

    firefox

    chrome

    safari

    ios

    android

    网站栏目维度 t_dim_section

    跳蚤市场

    房租信息

    休闲娱乐

    建材装修

    本地服务

    人才市场

  • 相关阅读:
    (转发)storm 入门原理介绍
    shell :将标准输出及标准错误输出写到指定文件
    shell循环(两个日期比较,改变某个特定日期来改变当前比较值)
    MongoDB基本操作
    (转)cenntos 安装mongodb
    通过spark sql 将 hdfs上文件导入到mongodb
    股票实战--线性回归
    Python PIL 的image类和numpy array之间的互换
    根据关键点的脸型的计算
    用反卷积(Deconvnet)可视化理解卷积神经网络还有使用tensorboard
  • 原文地址:https://www.cnblogs.com/yaboya/p/9333851.html
Copyright © 2011-2022 走看看