zoukankan      html  css  js  c++  java
  • Oracle数据库搬家牵扯出的一些知识点记录

    Oracle数据库搬家牵扯出的一些知识点记录

    工作原因,对开发服务器的数据库进行了迁移,实际执行操作之前查了一下迁移oracle数据库的可行方案,最后用了 exp/imp 进行导出导入(这个比较简单),以及附带看了一些表空间相关的知识点(重点哟),下面是一些记录。

    一、exp导出整个实例数据

    exp ****/****@**** full=y compress=n file=G:Sharecompress_N****.dmp log=G:Sharecompress_Nexp.log
    

    上述命令是我导出时采用的命令,其中用户名,密码及实例名应根据需求自己修改。

    full 参数代表导出的是整个实例的数据,若只想导出特定用户的相关数据,可通过owner参数指定。

    compress参数默认为Y, 这里并不是压缩dmp文件的意思,而是代表对该表空间下的文件碎片进行整理(数据存放的时候可能会在磁盘产生的碎片文件),同时很重要的一点是指定为Y时,表的尺寸会定义为该表当前实际占用的空间尺寸。即:或许你曾经在某个表空间内存放了一千万的数据,使得文件占用了10G或者更大的空间。后来因为某些原因删除了数据,而且也没有对表空间进行压缩整理,此时使用exp导出并指定compress为y,在使用imp导入至新的实例后,你会发现,即使表空间内并未存储任何大数据,但是新生成的表空间文件仍然占用了10个G或者更大的空间。

    grant参数是导出授权相关的信息,默认为Y,此处便省略了,但是这一点还是要知道的。

    关于exp的其他参数,可以使用 exp -help 自行查阅,也可阅读 ColinJames--Oracle数据库exp和imp方式导数据 进行查看。

    二、imp导入的相关操作

    1、创建一个数据库实例,根据情况选择数据库存放位置,为了方便管理,建议不要使用默认的存放位置。

    2、如果导出时使用了dba权限的用户,那么在导出时也应该使用具有dba权限的用户。所以,根据导出时的用户是否为数据库自带用户,是否具有dba权限判断是否需要创建用户并赋予DBA权限。如果导出时使用的是数据库自建用户,例如system,sys,而且也不想修改数据库文件所在的位置,请跳过步骤3、步骤4、步骤5创建表空间和用户的操作。

    3、在新数据库下创建与原实例相同的表空间。(导入后补充:根据导入时的日志看,直接使用imp应该也可以导入,但是生成的表空间文件应该是与原来的存放位置相同,笔者未进行直接导入的测试,请自行测试。如果不想将表空间文件与原数据库的目录一致,还是需要创建好以后再导入)

    ​ 创建时可使用下面的命令在原数据库下执行,批量生成sql语句。

    --推荐使用本条语句
    --创建所有已存在的表空间
    -- tsds 意指 tablespace definition statement
    --v$tablespace是一个内置视图,可以查询本实例下的所有表空间,其余与上方类似。
    select 'create tablespace ' || space ||
           ' Datafile "数据文件存放路径' || space ||
           '.dbf" size 20M autoextend on next 20M maxsize unlimited extent management local;' as tsds
      from (select name as space from v$tablespace where name not in('USERS','SYSTEM','SYSAUX','TEMP'));
    
    
    --创建所有用户的默认表空间
    --dba_users 内存放着用户及表空间的对应关系,产生的语句会创建所有用户的默认表空间,数据文件的初始大小及扩展容量可自行修改,另外生成的sql语句内需要自行指定文件存放位置并将 “ 替换为 ‘ 才可正常运行。(一般文本处理软件都可以批量替换)
    select 'create tablespace ' || space ||
           ' Datafile "数据文件存放路径' || space ||
           '.dbf" size 20M autoextend on next 20M maxsize unlimited extent management local;' as tsds
      from (select distinct default_tablespace as space from dba_users u where u.default_tablespace not in('USERS','SYSTEM','SYSAUX','TEMP') );
    
    --鉴于有些人建用户时忘记调整默认表空间,建表时却指定了某个表空间,所以最好使用第一条语句
    

    4、创建用户并指定默认表空间。

    ​ 同样提供了如下生成sql的语句,需要在原数据库下执行

    -- 此处需要自行指定用户密码
    select 'create user ' || username ||
           ' identified by **** account unlock default tablespace ' ||
           spacename || ' ;' as userds
      from (select username as username, default_tablespace as spacename
              from dba_users         
             where username not in ('ANONYMOUS',
                                    'CTXSYS',
                                    'DBSNMP',
                                    'DIP',
                                    'DMSYS',
                                    'EXFSYS',
                                    'MDDATA',
                                    'MDSYS',
                                    'MGMT_VIEW',
                                    'OLAPSYS',
                                    'ORDPLUGINS',
                                    'ORDSYS',
                                    'OUTLN',
                                    'SCOTT',
                                    'SI_INFORMTN_SCHEMA',
                                    'SYS',
                                    'SYSMAN',
                                    'SYSTEM',
                                    'TSMSYS',
                                    'WMSYS',
                                    'XDB')
                                    order by username );                             
    

    5、登录新的数据库,执行生成的 tsds 和 user_ds 语句,注意执行顺序,先创建表空间,在创建用户。

    6、使用imp执行导入。

    imp ****/****@**** full=y file=G:Sharecompress_N****.dmp log=G:Sharecompress_Nimp.log 
    

    如果没有提前建立用户,则用户密码与原库相同。

    imp有一个ignore的参数,代表忽略创建错误,默认为N,此处并未开启。在导入过程中会出现诸多表空间及用户的创建错误,此类错误可忽略。

    其余参数及参数含义可在命令行使用 imp -help自行查阅。

    至此,imp导入就算结束了。

    三、数据库表空间物理文件缩小

    会有这个小节是因为第一次导出的时候不知道加入 compress = n 的参数,导致只有很少数据量的一个库占用了30多G的磁盘空间,为了减少占用,看了一些跟压缩表空间相关的内容,在此做些记录。

    *1. 总结提前声明

    • 有一些概念还没说到,如果你不懂什么意思,可以先了解一下,看完其他的内容以后再回来看第二遍。
    • 并不是物理文件过大就需要将其缩小,我这边进行处理是因为这只是个开发库备份,另外我对这个库也足够清楚,知道这个表空间文件不正常,而且也不会再向这个表空间内写入数据。
    • 在使用EXP 导出时指定 compress参数,可以有效的减小物理文件的大小。采用默认值导出导入后物理文件是30多G,设置参数后是15G多一些,减少了一半。至于为什么还有这么多,在我查看段信息后发现了几个异常的表和索引,这几个异常对象初始时分配了最高4G的空间,是主要祸首。以我自己的操作过程及现在的理解来看,如果没有那几个初始值异常大的表定义和索引定义,导出的结果是符合我的预期的。
    • 以缩小表空间为关键字搜索,很容易就会找到一些文章告诉你要先使用shrink space压缩段,然后通过 resize 命令缩小表空间的物理文件,不过在我实测后发现,这种方法的适用范围很苛刻,它要求你所操作的段数据刚好位于表空间的末尾,即你所操作的数据段刚好占据着已使用的最大块,此时对段进行压缩操作,然后resize,表空间文件才可以缩小。
    • 举例来说,假设一个表空间内有AB两张表,每十万数据占用10M磁盘空间,我们分两种情况来看。第一种情况,先向A表内写入100W数据,然后删除A表内的40W数据,占用空间少了40M,这时执行shrink spaceresize 60M,物理文件确实会按预期缩小。第二种情况,先向A表写入了100W数据,又向B表写入了10W数据,最后将A表内的数据删除了90W,此时对A段Shrink,对表空间Resize,然后就会触发 ORA-03297:文件包含在请求的RESIZE值以外使用的数据,这里面会涉及到数据块的概念,因为B表内写入的数据占用了表空间内更靠前的数据块,没办法调整物理文件大小,而且实际情况下,数据的写入是无法预期的,所以此方法无用。
    • Shrink Space做了什么?需要说明一下,这是在Oracle 10g中新增的功能,用来优化数据段的高水位(HWM)问题,高水位会导致查询时扫描的数据块过多,影响查询时的速度,所以需要优化。关于高水位的内容,可查看 arctic_fox的文章 - oracle 高水位线详解,另外需要注意的是shrink segment的操作会改变数据的rowid,也就是改变了数据的物理位置,该命令会自动重建索引,但是会导致已打开的游标失效,如果要在生产环境使用,必须要慎重。
    • EXP/IMP,这应该是最简单的方法了,也是我采用的方法。在对表空间内需要整理的段进行收缩整理后,查询dba_free_space可以看到处于未使用状态的区间编号,如果这个表空间不会再次插入新数据,可以指定当前用户重新导出,再次导入后,可以发现物理文件已经缩小到了自己可接受的程度。
    • move tablesapce 的方法只是看了看,未进行实操验证,如果您无法或不方便执行数据的导出导入。建议点击一泽涟漪 - Oracle收缩表空间查看原文了解相关内容,还有这篇菜鸟程序员 - ORACLE修改表空间方法

    2、一些预备知识

    • oracle内置一些表和视图,以user_开头的可以查询当前用户拥有的所有对象,以all_开头的可以访问当前用户拥有访问权限的对象(可以是其他用户的对象),以dba_开头的需要dba权限,可以访问数据库内的所有对象。

    • 表空间的存储结构在逻辑上的数据结构如下:

      tablespace(表空间) - segment(段) - extent(区) - block(块)

      数据存储在Block数据块中,数据块对应在物理磁盘上;一个或多个连续的数据块组成区,区不能跨段,一个区只属于一个段;所以,区也只是一个逻辑上的概念,区与实际存储数据的块关联,段信息的汇总展示会更简单明了。

      段是由区组成,段中会存在一个初始区,用于存放数据,空间不够时会自动分配新的区,实际上就是分配了新的数据块存放数据,区号是按顺序排列的,块可以优先使用当前未分配的空间(可以在dba_free_space中查看)。

      表空间则是段的容器,一般oracle会为表或索引创建一个段,用于存放表或索引的数据,称为表段或索引段,每个分区表也是一个独立的段,关于段的具体类型,可以在dba_segments中查看 segment_type字段的标注。

      另外,在数据库安装时会有一个界面显示系统的块大小,默认为8K,也可以通过 select value from v$parameter where name='db_block_size' 自行查询数据块的默认值。

      关于表空间结构更详细的描述,请自行查看 oracle 物理结构(表空间,段区块)_tyhawk的博客-CSDN博客

    • 几个内置对象

      dba_data_files 可以在这里查看表空间的一些数据,比如物理文件位置,表空间大小,是否可用,是否自动扩展,扩展大小等信息,file_id可以在这里取(file_id)

      dba_segments 可以查看段的信息,比如段的所有者,段的类型,段的名字等

      dba_extents 和上面类似,可以查看所属段的信息,分区ID(extents_id)以及块ID(block_id,区的起始块),另外查询的时候最好指定file_id,不然会很慢。

    v$datafile 可以查看偏向物理文件的一些信息,file_id可以在这里取(file#)

    dba_free_space 可以查看当前表空间文件的未使用区间,如果查询到了过多的结果,其实也是当前表空间内碎片过多

    • 几个查询语句
    --查询表空间及其物理文件位置
    select t1.name,t2.name 
    from v$tablespace t1,v$datafile t2
    where t1.ts# = t2.ts#;
    
    --查询数据库的 block_size
    select value from v$parameter where name='db_block_size';
    
    --查看指定表空间内指定段的分区信息
    select * from dba_extents t where t.FILE_ID = 00 and t.segment_name = 'XXX';
    
    
    • 整理段的语句
    --需要先打开行移动,否则有 ORA-10636 ROW MoVEMENT is not enabled的报错
    alter table history.TB_FT_BALANCE enable row movement;   
    
    alter table history.TB_FT_BALANCE shrink space;   
      --shrink segment的操作会改变数据的rowid
      --另外看到有人说执行shrink space时之前的游标会失效,生产上还是要慎重一点
    alter table history.TB_FT_BALANCE deallocate unused;
     
    alter table history.TB_FT_BALANCE disable row movement;
    
    

    关于 Row Movement,可以看这里:Enmotech - 深入解析 Row Movement 的原理和性能影响与关联

    上面说了,oracle一般会为表分配一个段,所以可以只操作曾经有过大量数据后来又被删除的表,压缩表段其实也就是整理表碎片

    • 改变表空间物理文件大小的语句如下
    alter database datafile '/u01/test01/t11.dbf' resize 5m;  
    --参数自行修改,另外如果指定的空间大小无法存放已有的数据,此处会报错
    
    --至于具体应该指定的数值可使用如下语句获取
      --获取表空间文件编号
     select file#,name from v$datafile;  --此处取出表空间文件的file#编号
     --通过最大块确定指定文件占用的空间
      select (max(block_id) + blocks)*8/1024 from dba_extents where file_id={$file#}; --单位为 M,块大小采用默认值 8K。
      -- alter时resize的参数必须要大过查询结果
      
    

    如果表空间已经被占用过,即使将表数据删除,上面的语句查询出来的结果也并不会差太多,因为被占用的空间并没有被释放。

    3、个人操作

    需要声明的是在进行此处的操作时,我并不知道加入 compress 参数的做法,此时的物理文件也有30多G。

    先使用下方语句查看了一下占用空间较大的segment

    --指定file编号,获取当前文件内的段信息
    select t.owner,              
           t.segment_name,
           t.partition_name,   --分区名,一个段可能有多个分区
           t.segment_type,     --段类型
           t.tablespace_name,
           t.BYTES/(1024*1024) as MB, --段大小,单位是MB
           t.BYTES,            --段的大小,单位是 byte
           t.initial_extent    --初始化时分配的大小
      from dba_segments t
     where t.relative_fno = {$file#}
     order by t.BYTES desc;
    

    找到了一个占用达1G,但实际没有数据的的表段,使用如下语句进行表段的整理:

    alter table history.XXXX enable row movement;   
    alter table history.XXXX shrink space;     --shrink segment的操作会改变数据的rowid,使已打开的游标失效
    alter table history.XXXX deallocate unused;
    alter table history.XXXX disable row movement;
    

    操作后可再次执行段信息查询语句,会发现该段占用空间明显缩小。

    发现上述操作确实可以使得表段占用空间减少后,我并没有去怀疑网上直接resize文件的做法是否可行,反而是在查看了dba_segements 的查询结果后,发现需要执行该套操作的表段实在有点多,出于偷懒的想法,才重新进行百度,并找到了加入 compress 参数的建议。在实操验证后,发现物理文件缩小到了15G,只是这个大小仍然远远超过我的承受范围,所以我还是准备采用上面说到的方法进行操作。

    在一张几十万数据的测试表内删除了数据后,对该表段执行了压缩操作,此时,有些文章就会告诉你可以进行alter database datafile 'xxx' resize 0m 的操作,利用sql查询到当前实际占用的空间后,实操进行验证,过称中触发了ORA-03297的错误,当时猜测是因为释放出来的空间仍以碎片形式存在,数据库系统并不会将数据依次前移去填充空白碎片区间,于是自己分两种情况进行了验证,得出了这种方法并不通用的结论,验证时区分的两种情况以及对 shrink space 的说明请查看本节开篇的总结了解。

    在明确知道压缩段无法满足我的需求后,整理得到的碎片空间会如何利用又引起了我的兴趣,于是在另外一个表空间内我对两张表分别写入了几百万数据,然后使用delete删除了一部分数据并整理得到了一部分未使用的碎片空间,查询dba_free_space后,得到未使用的block_id范围。在之前的两张表AB以及一个未整理过的C表内插入数据,发现碎片的block会按照使用者的顺序进行分配,也就代表在A表内整理得到的空间并不局限于只能A使用,其他的 B,C表也可以分配空白区域的block,其实到这里,我才明白了Extent存在的意义,段所代表的上层无需知道实际存储数据的地址,只需要知道区号即可,根据extent_id再去查找实际使用的block.

    到这之后,无奈又得重新找方法,然后找到了 一泽涟漪 - Oracle收缩表空间这篇文章,博主的方法其实是将数据移到了新的表空间,然后将其指定为原用户的默认表空间。看过之后,因为担心 lob 字段的数据会不会丢失,也不知道当前表空间下的SP,Function会怎么样,所以我并没有按照这种方法操作。如果想使用move的方法,建议同时阅读一下这篇文章菜鸟程序员 - ORACLE修改表空间方法,这里面有对 lob的一些说明。

    进展到这其实陷入了一种僵局,直到我无意中看到dba_segmentsinitial_extent字段,发现几个对象的初始值过大。于是使用工具 rebuild 了这几张表,重建之后查询段信息发现多了几条段名称乱码的数据,该工具重建时没有释放表占用的空间,如果读者有重建表的需求,建议先保留表相关的定义及表数据,然后删除重建。

    delete、drop、truncate的区别可查看weixin_33871366 - oracle中delete drop truncate的用法和区别

    对于未被释放的段,查找无果后,决定重新对该用户执行 exp/imp 的操作,操作后惊喜的发现,新的表空间内已经不存在那几个乱码的段信息,而且物理文件也缩小到了我可以接受的程度,至此,缩小表空间的物理文件终于是找到了一个合适的方法。在此之后也想到了这和move tablespace其实本质上是一样的。

    4、Move Tablespace

    本节是对上面提到的两篇文章的一些记录,move tablespace的方法我并没有测试,另外我感觉move更有用的点应该是可以移动表到新的表空间(建表时搞错表空间的经历,不会只有我有吧 >_<)

    • 移动数据段至新的表空间时,对表和索引的是一种处理方式,对lob字段是另一种处理方式

    • 系统会为 lob 字段分配一个segment 用于存放数据,关于两种处理方式可以看获取更多的说明。

      上方两条说明是为了下面的操作步骤做准备,下面开始使用move。

    • 新建一个表空间

      create tablespace TS_New Datafile 'E:TS_New.dbf' 
      size 200M autoextend on next 100M maxsize unlimited extent management local;
      
    • 生成 table 的move语句

      select 'alter table ' || owner || '.' || segment_name || ' move  tablespace TS_New;' sqltext from dba_segments where  tablespace_name = 'TS_HISTORY' and segment_type='TABLE';
      
    • 生成 index 的move语句

       select 'alter index ' || owner || '.' || segment_name || ' rebuild tablespace TS_New;' sqltext from dba_segments where tablespace_name = 'TS_HISTORY' and segment_type='INDEX';
      
    • 生成 lob段的 move语句

      select 'alter table ' || owner || '.' || table_name || ' move lob(' || column_name || ') store as(tablespace TS_New);' sqltext from dba_lobs where tablespace_name = 'TS_HISTORY';
      

      lob段数据的迁移建议查看菜鸟程序员 - ORACLE修改表空间方法,里面对语句及参数介绍的比较明白,而且还考虑了表,分区表的情况,这里我就不搬过来了。

  • 相关阅读:
    BZOJ1527 : [POI2005]Pun-point
    2016-2017 ACM-ICPC Southwestern European Regional Programming Contest (SWERC 2016)
    2016-2017 ACM-ICPC Northwestern European Regional Programming Contest (NWERC 2016)
    NAIPC-2016
    BZOJ2498 : Xavier is Learning to Count
    ACM ICPC Vietnam National Second Round
    XVI Open Cup named after E.V. Pankratiev. GP of Ukraine
    XVI Open Cup named after E.V. Pankratiev. GP of Peterhof
    HDU5509 : Pattern String
    BZOJ4583 : 购物
  • 原文地址:https://www.cnblogs.com/lihaijia/p/14507361.html
Copyright © 2011-2022 走看看