(原创声明,转载引用需要指明来源)
上一节我们讲述excel能够用于基本数据分析,但诸多中大型企业不会用excel作为数据库。
Excel存放数据量在百万条左右,如果数据量太大,则容纳不下。这时关系型数据库管理就登场了。关系型数据库管理同样也是所有现代数据库系统的基础,比如 MS SQL Server、IBM DB2、Oracle、MySQL 以及 Microsoft Access。
SQL,指结构化查询语言,全称是 Structured Query Language,用于访问和处理关系型数据库管的标准的计算机语言。SQL 也是一种 ANSI(American National Standards Institute 美国国家标准化组织)标准的计算机语言。
在中大型公司,如果不会sql语言,就无法开展数据分析工作。数据分析师的大量时间都在写sql,把几十上百张表格关联起来,整合成一张宽表。写SQL是数据分析师最基础工作之一。
SQL具体能做工作包括:
SQL 面向数据库执行查询
SQL 可从数据库取回数据
SQL 可在数据库中插入新的记录
SQL 可更新数据库中的数据
SQL 可从数据库删除记录
SQL 可创建新数据库
SQL 可在数据库中创建新表
SQL 可在数据库中创建存储过程
SQL 可在数据库中创建视图
SQL 可以设置表、存储过程和视图的权限
SQL 是一种标准 - 但是...
虽然 SQL 是一门 ANSI(American National Standards Institute 美国国家标准化组织)标准的计算机语言,但是仍然存在着多种不同版本的 SQL 语言。
虽然存在多种不同版本SQL语言,但为了与 ANSI 标准相兼容,它们必须以相似的方式共同地来支持一些主要的命令(比如 SELECT、UPDATE、DELETE、INSERT、WHERE 等等)。因此诸多版本SQL语言大同小异,初学者不必过于担心。