面试功略:数据仓库工程师经常遇到的题目
什么叫数据仓库?(相信inmon的数据仓库概念的四个特点是最基本的吧,当然需要加上自己的理解)
数据仓库和数据库有什么区别?(事务性数据库和决策支持数据库的区别,当然包括目标、用途、设计等等)
什么叫OLAP?用途是什么?(OLAP指多维数据库了,主要用于多维分析了;包括三种实现方式)
什么叫维度和度量值?(一个是出发点,一个是观察值)
数据仓库的基本架构是什么?(数据源,ETL,data stage,ODS,data warehouse,datamart,OLAP等等,可能为针对每一个结构进行发问啊)
什么叫缓慢维度变化?(为了表现和记录基础数据变化情况在数据仓库中的记录,包括三大类维度处理方式,缓慢变化维包括三小类)
什么叫查找表,为什么使用替代键?(其实目的和上面一样,从基础表到缓慢维度表的过程中的一种实现途径)
如何实现增量抽取?(主要采用时间戳方式,提供数据抽取和处理的性能)
用过什么ETL工具(informatica,ssis,owb,datastage),以及该工具简单讲述特点。
ETL都包括那些组成部分(工作流和数据流,数据流包括若干组件处理ETL的各个环节)
用过什么报表工具(bo,Hyperion">hyperion,congo,reporing servce),以及该工具基本特点。
数据仓库项目最重要或需要注意的是什么,以及如何处理?(一般答数据质量,主要是数据源数据质量分析,数据清洗转换,当然也可以定量分析)
关于数据库部分的面试题(不是要DBA的,但是还是要具备DBA的部分知识结构)
用过什么数据库(SQLServer,Oracle),讲述其物理和逻辑结构,以Oracle为主.
能够写基本的SQL语句,分组函数和关联,一般会给几个例子。
如何进行性能优化,只要能答索引的基本原理以及各种索引的区别即可。
事实上,数据仓库和DBA或者其它技术不尽相同,没有绝对的答案,大家只要能表达和描述清楚自己的观点就可以了
数据仓库和数据库有什么区别?(事务性数据库和决策支持数据库的区别,当然包括目标、用途、设计等等)
什么叫OLAP?用途是什么?(OLAP指多维数据库了,主要用于多维分析了;包括三种实现方式)
什么叫维度和度量值?(一个是出发点,一个是观察值)
数据仓库的基本架构是什么?(数据源,ETL,data stage,ODS,data warehouse,datamart,OLAP等等,可能为针对每一个结构进行发问啊)
什么叫缓慢维度变化?(为了表现和记录基础数据变化情况在数据仓库中的记录,包括三大类维度处理方式,缓慢变化维包括三小类)
什么叫查找表,为什么使用替代键?(其实目的和上面一样,从基础表到缓慢维度表的过程中的一种实现途径)
如何实现增量抽取?(主要采用时间戳方式,提供数据抽取和处理的性能)
用过什么ETL工具(informatica,ssis,owb,datastage),以及该工具简单讲述特点。
ETL都包括那些组成部分(工作流和数据流,数据流包括若干组件处理ETL的各个环节)
用过什么报表工具(bo,Hyperion">hyperion,congo,reporing servce),以及该工具基本特点。
数据仓库项目最重要或需要注意的是什么,以及如何处理?(一般答数据质量,主要是数据源数据质量分析,数据清洗转换,当然也可以定量分析)
关于数据库部分的面试题(不是要DBA的,但是还是要具备DBA的部分知识结构)
用过什么数据库(SQLServer,Oracle),讲述其物理和逻辑结构,以Oracle为主.
能够写基本的SQL语句,分组函数和关联,一般会给几个例子。
如何进行性能优化,只要能答索引的基本原理以及各种索引的区别即可。
事实上,数据仓库和DBA或者其它技术不尽相同,没有绝对的答案,大家只要能表达和描述清楚自己的观点就可以了