SQLServer DBA 三十问之我答（第1~10题）

zoukankan html css js c++ java

SQLServer DBA 三十问之我答（第1~10题）

首先声明：这是本人的答案，并非官方答案，不要盲目追捧，因为觉得这问题很具有代表性，很多人想了解，所以记下，顺便让广大园友也来给本人打打分。因为本人平时用sqlserver2000，所以大多基于sql2000回答。
原帖地址 http://www.cnblogs.com/fygh/archive/2011/10/18/2216166.html
问题如下：
1. char、varchar、nvarchar之间的区别（包括用途和空间占用）；xml类型查找某个节点的数据有哪些方法，哪个效率高；使用存储
   过程和使用T-SQL查询数据有啥不一样；
答：char 是定长的字符类型，若长度不够自动在后面补足够的空格；varchar是可变长度的字符类型，具长度体根据存入的数据而定；nvarchar可理解为unicode的可变长度字符类型；
xml类型的字段没用过，因为感觉xml用不上索引；
2. 系统DB有哪些，都有什么作用，需不需要做备份，为什么；损坏了如何做还原（主要是master库）；
答：master 主要保存系统级的信息，比如本数据库实例都有哪些数据库，都有哪些账号等，需备份；
model 模板，每创建一个数据库，都会根据这个库的结构来创建，如果改过此库，建议备份；
msdb 保存计划任务，作业之类的信息，需备份，否则会丢失作业和备份计划；
tempdb 用户对sqlserver操作时产生的临时数据依赖于此库，最常见的是临时表，不许备份；
resource 这个是sqlserver2005新增的只读数据库，保存了sqlserver的系统对象，如sys.objects,建议备份，磁盘损坏时需要；
master的还原要依赖于sqlcmd，估计很少人经常干这事，所以这时候应该查下资料；
3. 有哪些操作会使用到TempDB；如果TempDB异常变大，可能的原因是什么，该如何处理；
答：每个sqlserver运行时所产生的临时数据都会用到tempdb，最常见的是执行sql脚本需要返回的记录集；
异常变大的原因是执行的操作返回的记录集过大造成，找出该语句优化，减少数据范围，或者分批操作这些数据；
4. Index有哪些类型，它们的区别和实现原理是什么，索引有啥优点和缺点；如何为SQL语句创建合适的索引，索引创建时有哪些需要
    注意的项，如何查看你创建的索引是否被使用；如何维护索引；索引损坏如何检查，怎么修复；T-SQL有更好的索引存在，但是运行
    时并没有使用该索引，原因可能是什么；
答：聚集索引，非聚集索引；聚集索引只能有一个，非聚集可有多个，数据依赖于聚集索引来保存，如果没有聚集索引，数据是一个乱序的堆；
优点：合适的索引可有效提高查询效率；缺点：过多的索引，在insert、update 和 delete 的时候增加索引的维护成本，降低并发量；
一般索引的创建要依赖于 where 和 order by 这两个关键字，执行计划可以看出是否用到了索引；
还没遇到过索引损坏的情况，如果损坏，重建之；
用不到索引可能是索引碎片过多，可进行碎片整理，若不行可加强制索引with(index( 索引名 ))

5. 视图上我们能建索引吗，如果能建的话，会啥好处和坏处；视图上建索引和表上建索引有啥区别；
答：有索引视图，不过本人从来不用，因为视图被定义为一个虚拟表，如果对其创建索引，需要具备一些苛刻的条件，也不易维护，所以从来不用；
6. Job信息我们可以通过哪些表获取；系统正在运行的语句可以通过哪些视图获取；如何获取某个T-SQL语句的IO、Time等信息；
答：sql2000下是通过 master.dbo.sysjobs 来查看作业信息；系统正在运行的语句可通过 master.dbo.sysprocesses 结合 dbcc inputbuffer 来查看，一般查堵塞这个很管用（关于堵塞的定位可看我的另外一篇博客，sqlserver阻塞定位  ）；
IO，在sql2000下我本人都是通过profiler看reads，duration，sql2005下有了动态视图（dmv）；
7. 在线系统，一个表有五千万记录，现在要你将其中的两千万条记录导入到另一台服务器的某个表中，导完后，需要将这两千万数据删
   除，你预备如何处理，优缺点是什么；
答：这个的我之前专门写了一篇博客，在这里 SQLServer DBA 三十问之我答（第7题）
8. 数据库服务器报磁盘空间不足，你将如何应对，要求尽快恢复；
答：如果是日志文件太大，备份日志，sqlserver会自动截断日志；
如果是数据文件过大，赶紧转移到一个足够大的硬盘上，然后再想办法拆分库，一般一个库100G应该差不多，如果太大备份还原什么的都不是很方便，至于拆分方案那不可一概而论；
9. 临时表、表变量、CTE(公用表表达式)有啥区别和联系，保存位置有啥不一样，使用时如何决定选哪种；
答：临时表，保存在 tempdb中，
表变量保存在内存中，他和临时表的区别是一个是保存在tempdb，一个保存在内存中，
cte是sqlserver2005新增的，是把一个记录集当做一个变量来使用，他跟表变量的区别是不需要insert数据，所以应该比表变量更高效；
如果只使用一次cte应该是最好的，如果要重复多次使用同一个记录集，我个人认为还是表变量，
如果你还需要用到truncate语句来清除临时的数据，那最好用临时表，因为表变量不支持truncate，可参考我的另一篇本质：sqlserver为什么表变量不能truncate

10. SQLServer有哪些隔离级别，默认级别是哪个；数据库有哪些主要的锁类型；行版本控制是如何实现的；
答：隔离级别： read uncommitted，相当于给每个select 加with(nolock), 会产生脏读，为提高并发量可设置此选项；
read committed 不允许脏度，默认级别；repeatable read 锁定select的数据集；serializable 相当于在select的表上加 with(holdlock),从来没用过；
books online 里查 set transaction isolation level 可查到。

后语：刚开始看这题目的时候，感觉都经常用到，应该很easy，但是真正要回答的时候发现不知道该怎么表示，最后还是花了不少时间来查一些资料，也算是对自己知识的再巩固。可能有些回答的不一定准确，如果哪位仁兄另有高见，不妨赐教一二，也可经常切磋切磋，共同进步。从本人招聘的经历来看，做asp.net开发的能答对第1、第4题已经算是很不错的了，从这点可以看到sql是广大的程序员的弱项。

查看全文

相关阅读:
Kudu vs HBase
数据分析怎么更直观？十分钟构建数据看板
 The Beam Model：Stream & Tables翻译（上）
3分钟掌握一个有数小技能：收入贡献分析
 猛犸机器学习开发实践
 SparkSQL大数据实战：揭开Join的神秘面纱
 细说Mammut大数据系统测试环境Docker迁移之路
 python中的闭包与装饰器
 import详解
 python中的with与上下文管理器

原文地址：https://www.cnblogs.com/gezifeiyang/p/2255546.html