数据管理解决的问题:
传统的数据库可以告诉我们“发生了什么”,而数据仓库和数据挖掘分析系统可以告诉我们“为什么发生”和“下一步该如何做”。在规划初期,将面临两种选择,需要处理的数据粱比较少或者不知道那些数据是重要的(可能都是重要的),而且决策目标明确(例如:选择最佳的媒体进行广告投放或者选择最佳的方式和地区做推广)时,可以借助于运筹学模型或统计方法进行规划设计(以往常常是根据经验),主要在事务型数据库中完成。
当数据量巨大或决策目标不明确时,只能借助高效的数据挖掘。数据挖掘的目的是从存储于大型数据库或数据仓库的数据之中发现某些重大的,有价值的知识,挖掘算法主要有:关联挖掘,分类挖掘,聚类分析,特征话分析,比较挖掘,预测挖掘及时间序列分析等,通过集成,数据挖掘能够更加方便地挖掘有价值的信息。
选择挖掘分析工具和建立面向应用的语意层是两个重要的解决方案
数据挖掘的主要功能包括特征化 分类 比较 关联 预测及聚类分析
网络游戏运营中的信息过量几乎成为每个管理者需要面对的问题,如何才能不被信息的汪洋大海所淹没,从中及时发现有用的数据,提高信息获取率?要想使数据真正成为资源,只有充分利用他为自身的业务决策和战略发展服务才行,否则大量的数据可能成为包袱,甚至成为垃圾。因此,面对“被数据淹没,却饥饿于知识”的挑战,数据挖掘和知识发现(DMKD)技术越来越显示出其强大的生命力。
数据挖掘(Data Mining)就是从大量的,不完全的,有噪声的,模糊的,随机的数据中提取隐含在其中的,事先不知道的,但又是潜在有用的信息和知识的过程。还有很多和这一术语近似的术语,如从数据库中发现知识(KDD),数据分析,数据融合(Data Fusiom)以及决策支持等。
数据挖掘技术从一开始就是面向应用的,他不仅是面向特定数据库的简单检索查询调用,而且要对这些数据进行微观,中观乃至宏观的统计,分析,综合和推理,以指导实际问题的求解,企图发现事件间的相互关联,利用已有的数据对未来的活动进行预测。
BI(Business Intelligence)商务智能,是企业利用现代信息技术收集管理和分析结构化和非结构化的商务数据和信息,创造和累计商务知识和见解,改善商务决策水平,采取有效的商务行动,完善各种商务流程,提升各方面商务绩效,增强综合竞争力的智慧和能力。
BI是如何产生的?
最初在商务交易中引入计算机辅助管理时,开发人员根据企业已规定好的业务规则来编写交易系统。此时的商务系统主要目的是让“商务流程自动化”,从而缩短业务周期,提高效率,增强企业的竞争力。如今软件厂商针对新出现的商业部门和业务规则,推出了一系列的自成体系的专门针对某块商业数据管理的管理软件,如财务管理软件,客户关系管理软件,产品数据管理软件,人力资源管理软件等。这些自成体系的管理软件之间,数据很难共享,而形成了“信息孤岛”的现象,于是又推出了更大块集成的企业资源规划(ERP)系统,把之前推出的各块独立的管理系统整合起来。
网络游戏运营需要根据自己的业务进行量身定制,将自己的数据源和业务需求理清楚,然后将中间搭桥的工作做好,必须注意业务与技术的协调。
领导的需求度,信息技术基础设施,分析型的应用需求以及竞争的激烈程度这四项因素是影响企业实施数据仓库进度的关键因素。规模越大,历史数据越多,实施数据仓库的迫切性越高。
一用户需求分析
1什么样的报表是当前使用的
广告投放和市场宣传推广报表,市场行销效果报表,游戏用户增长变化报表,用户行为报表,游戏服务器状况报表
2什么样的报表是经常使用或很少使用的?
经常用的报表:广告投放效果报表 在线用户人数变化报表 消费/收入报表线上/线下活动效果报表
3是否需要钻取到详细报表,汇总报表或两者结合?
4通常报表需求如何,为确保数据准确性,能否及时提供报表?
分析规律,报表的及时性与游戏运营公司的管理水平有关
5各部门管理者通常关系的报表有哪些,最关心指标有哪些
市场部门:广告和宣传效果报表与用户人数变化报表具有密切关联,关心投入产出比率和用户转化率
产品部门:IDC负载情况 在线用户人数变化报表 用户消费情况报表
客服部门:在线人数变化报表与用户在游戏中的行为报表
相关报表还有很多,网络游戏最核心的数据都是围绕用户而产生的,可以说用户是网络游戏运营的核心,用户贡献情况(赢利)是最关心的指标,其他数据都是围绕这个指标。
6在业务部门中哪些部门是业务核心?
市场部门业务核心是宣传与广告
产品部门业务核心是游戏运营维护
渠道部门业务核心是渠道拓展与推广
客服部门业务核心是线上/线下客户服务
相关工作流参考:游戏业务单元概述,游戏运营流程概述,业务单元协作分析等资料
网络游戏运营的大忌是缺少规划的随意性。
二网络游戏运营源数据分析
通过下列问题以分析源数据
1数据来自一个源,还是多个源?
网络游戏运营的数据源有多个,其中最主要的属于源是官方网站和游戏客户端/服务器,其他则根据运营状况不同而定。
2数据是存储在一个地方还是多个地方
IDC机房是数据的主要存储地,由于网络游戏运营中大量数据的产生,对数据的理解和描述是一项基础工作。
3数据的存储格式是什么,是平面文件,电子表格文件还是数据库文件?数据库类型是?
网络游戏数据主要以电子形式,表格和数据库是其中的主要部分,数据库用户资料数据库和行为数据库都属于大型数据库。
4数据量有多大?
网络游戏数据量非常之大,即使发展到今天,也无法对所有数据有一个全面的估量。
5希望访问多少数据
希望从业务需求方面访问数据,对内是用户(游戏玩家)行为,对外是自身行为(广告宣传和市场行销推广)
6需要准备和清洗多少数据
网络游戏运营数据既有结构完整成系统的数据库,也有“有用”“无用”“不清楚用途”相混杂的,分散的数据。对数据的理解准备和清洗是一项非常庞大的工程。
7所有的数据项是否一致,数据一致化标准规范是什么?
网络游戏内部的数据项基本一致,但外部的数据项缺乏一致性,数据一致话标准还没有一个标准的规范。
8数据的更新频度为多少?
网络游戏的数据更新频度是实时的和随机的,数据更新频度与游戏运营的各个阶段相适应。
三访问安全性分析
1什么样的信息对特定的个人或工作组必须加以限制
根据部门和权限不同,网络游戏各部门人员只需要与本职工作有关的数据,数据权限由信息管理部门根据需求情况进行划分。
2按照信息需求和访问权限,将用户加以分组
网络游戏运营中,可以规划和执行分别赋予不同的权限,规划的责任重大,是信息的收集汇总分析发布和指导的中间环节。规划可分为:媒体宣传规划,线下市场行销推广规划,线上活动规划和运营整体规划。
3已有的用户分组是基于网络关系/业务关系/数据库访问欢喜划分?是否需要用户进行重新划分?
更准确地反映用户决策的角色是用户分组的目的,
四用户网络构架分析
1网络游戏运营公司的网络架构是基于网络的,业务系统运营的网络架构?分析系统计划采用什么网络架构?
2网络操作系统?(NT还是2000?)
3用户是否处于一个域中?
4网络数据传输状况?
五确定数据的整合策略
根据下列原则分析数据的整合策略
1根据用户的需求确定业务数据范围
网络游戏用户需求分析参考“网络游戏用户分析与定位--马斯洛理论需求分析”
2根据源数据分析结果和确定的数据范围制定数据的抽取策略和一致性处理策略
由于网络游戏运营主要源数据都在游戏运用公司范围内,对于数据的理解和分类就成为一项重要的工作,数据的抽取策略与业务需求相结合,由于运营中产生大量数据,非随机的定向抽取应是主要采取的策略。
数据
3确定数据抽取整合的处理机制