zoukankan      html  css  js  c++  java
  • 20万DBA都在关注的11个问题

    引言



    本文摘自『DBASK问答集萃第三期』,近期我们在DBASK小程序增加了众多专栏,其中包括盖国强、杨廷琨、罗海雄、张乐奕、黄廷忠、崔华、熊军、李真旭、何剑敏、刘伟等专家栏目,还有2019年6月SCN兼容性问题、XTTS、备份恢复等技术专栏,另外蚂蚁金服OceanBase入驻小程序。欢迎大家阅读分享小程序中的专题栏目。如果您乐于技术分享,欢迎联系小助手(ID:Enmoedu05),为您打造优质专栏。


    问答集萃



    接下来,我们分享本期整理出的问题和诊断总结,供大家参考学习,详细的诊断分析过程可以通过标题链接跳转到小程序中查看。


    问题一、RMAN-20039: format requires %c when duplexing


    备份时报错:

    1. RMAN-00571: ===========================================================

    2. RMAN-00569: =============== ERROR MESSAGE STACK FOLLOWS ===============

    3. RMAN-00571: ===========================================================

    4. RMAN-03009: failure of backup command

    5. RMAN-20039: format requires %c when duplexing


    备份数据文件不加%C就会报错,加%C有两份一样的?

    1. ----备份脚本

    2. run{

    3. allocate channel c1 device type disk;

    4. allocate channel c2 device type disk;

    5. allocate channel c3 device type disk;

    6. allocate channel c4 device type disk;

    7. crosscheck backup;

    8. sql 'alter system archive log current';

    9. backup spfile format '/bak/backup/spfile_%T_%s_%p_%c';

    10. #backup database format '/bak/backup/dbbk_0_%d_%t_%u_%s_%p';

    11. backup as compressed backupset incremental level 0 database format '/bak/backup/dbbk_0_%d_%t_%u_%s_%p';

    12. sql 'alter system archive log current';

    13. backup archivelog all format '/bak/backup/arc_%T_%s_%p_%c' delete all input;

    14. backup current controlfile format '/bak/backup/cntrl_%T_%s_%p_%c';

    15. crosscheck archivelog all;

    16. delete noprompt expired backup;

    17. delete noprompt obsolete;


    18. release channel c1;

    19. release channel c2;

    20. release channel c3;

    21. release channel c4;

    22. }


    诊断结论:如果设置不冗余就不需要加c%,否则就会出现你的报错。如果设置了冗余必须加%c,那么也就会产生相应的备份片。



    问题二、RAC实例无法启动ORA-01157 ORA-01110 ORA-27041 OSD-04002


    服务器未知原因故障恢复后,启动数据库实例报错,错误信息如下:

    1. ALTER DATABASE OPEN /* db agent *//* {2:38813:23181} */

    2. This instance was first to open

    3. Errors in file D:APP...orcl2_ora_7780.trc:

    4. ORA-01157: ????/?????? 11 - ??? DBWR ????

    5. ORA-01110: ???? 11: 'D:APP...NXPT.DBF'

    6. ORA-1157 signalled during: ALTER DATABASE OPEN /* db agent *//* {2:38813:23181} */...

    7. Fri Mar 01 10:00:59 2019

    8. Shutting down instance (abort)

    9. License high water mark = 2

    10. USER (ospid: 13460): terminating the instance

    11. Instance terminated by USER, pid = 13460

    12. Fri Mar 01 10:01:16 2019

    13. Instance shutdown complete

    14. Fri Mar 01 10:34:34 2019


    诊断结论:从报错看,这个是一个本地数据文件'D:APPADMINISTRATORPRODUCT11.2.0DBHOME_1DATABASENTBS.DBF',应该是将RAC中的数据库文件误建到本地磁盘,所以其他实例无法启动,导致错误。



    问题三、Oracle 12.2 expdp 非常慢


    我有一个12.2.0.1的库,非容器单实例。使用expdp导出,导出文件总共不到4G,但要花将近6个小时。alert没有任何报错。新库基本都是空的分区表。

    诊断结论:请先尝试收集系统、数据字典统计信息。另外可以尝试如下方法:

    1、 最小配置stream_pool_size最小到256M,可能的话设置512M或者1GB;

    2、加大expdp的并行度,如果CPU压力不大,可以设置为CPU核数的1半或更多;

    3、EXCLUDE=GRANT exclude = statistic

    4、METRICS=YES

    5、如果导出停留在TABLE_DATA阶段,并且上述处理无效,可以打补丁Bug 28100495



    问题四、RAC CTSS状态观察模式,时间不同步


    2节点RAC,其中一台物理故障。修复后RAC报CTSS状态为观察模式,时间不同步

    1. Oracle Database 12c Enterprise Edition Release 12.2.0.1.0 - 64bit Production 0


    2. PL/SQL Release 12.2.0.1.0 - Production 0

    3. CORE 12.2.0.1.0 Production 0

    4. TNS for Linux: Version 12.2.0.1.0 - Production 0

    5. NLSRTL Version 12.2.0.1.0 - Production 0

    6. CPUs:56 Cores:28 Sockets:2

    7. 内存188.26G

    诊断结论:CTSS状态为观察模式通常是因为本地的NTP服务启动了。所以可以先检查一下新修复的那台服务器上是不是默认启动了NTP。如果是,禁用掉通常就可以了。



    问题五、OGG-00665 OCI Error (status = 3114-ORA-03114)


    OGG 同步序列,进程ABENDING,重启进程问题仍然存在,数据库正常,其他ogg的进程正常,且排除掉该序列的同步后进程可以正常启动

    1. 2019-03-07 17:06:39 ERROR OGG-00665 Oracle GoldenGate Delivery for Oracle, rptsqe.prm: OCI Error describe for query

    2. (status = 3114-ORA-03114: not connected to ORACLE), SQL<select status, deferrable from dba_constraints where owner =UPPER('BOSDATA') and table_name='TASK_SEQ' and constraint_type = 'P' >.

    3. 2019-03-07 17:06:39 ERROR OGG-01668 Oracle GoldenGate Delivery for Oracle, rptsqe.prm: PROCESS ABENDING.

    诊断结论:

    1、我昨天查了很多资料,有一个同样的报错,RAC环境,OGG版本也是11.2,不过是抽取进程,说是重启集群后问题消失,所以以后再遇到SEQ同步报错了,可以尝试下。

    2、有可能是复制进程中的这个参数引起,或者未知BUG

    DBOPTIONS _NOAUTOMATICSEQUENCEFLUSH

    3、一般情况下目标端不会使用sequence,所以可以考虑排除所有SEQ的同步

    4、升级OGG版本,至少12



    问题六、数据库大量僵尸进程未自动清理


    数据库出现客户端连接不上,查看alert日志

    1. Wed Mar 13 09:21:50 2019

    2. ORA-00020: No more process state objects available

    3. ORA-20 errors will not be written to the alert log for

    4. the next minute. Please look at trace files to see all

    5. the ORA-20 errors.

    6. Process J002 submission failed with error = 20

    7. kkjcre1p: unable to spawn jobq slave process

    8. Errors in file /export/home/u01/app/oracle/diag/rdbms///trace/_cjq0_25517.trc:

    此时查看 v$process 为738个进程,参数process进程数设置为800.以下语句查询结果为380

    1. select count(*) from v$process where addr not in (select paddr from v$session);

    杀掉这些进程,客户端可以正常连接。总体进程维持在400左右。

    问题点:1、pmon为何没有清理掉这380个没有会话的进程。2、是否有参数设置pmon清除僵尸进程的条件,比如空闲时间之类的。

    诊断结论:一般kill session后会出现这种情况,但是不会出现几百个的情况。首先请检查是否存在频繁kill session的操作,和应用建立连接、断开连接的方式是否规范;其次,临时将数据库的process参数调高,避免应用出错。最后,提供一个自动清理僵尸process的脚本。



    问题七、oracle 10gR2 expdp报错ORA-00376


    expdp导出报错

    1. Connected to: Oracle Database 10g Enterprise Edition Release 10.2.0.1.0 - 64bit Production


    2. With the Partitioning, OLAP and Data Mining options



    3. ORA-39001: invalid argument value

    4. ORA-00376: file 53 cannot be read at this time

    5. ORA-01110: data file 53: '/oracle/oracle/oradata/xxx/xxx.dbf'

    53号数据文件由于硬件故障导致文件损坏,无法修复。库为非归当模式,所以将53号数据文件offline drop,将库强制启起来了。现在备份的时候报错了,导出命令如下;

    1. expdp user/passwd parfile=cfg_except_tables.cfg


    2. cat cfg_except_tables.cfg

    3. EXCLUDE=TABLE

    4. COMPRESSION=METADATA_ONLY

    5. DIRECTORY=DPUMP_DIR1

    6. DUMPFILE=auto_backup.dmp

    7. LOGFILE=auto_backup.log

    通过如下SQL查为空,我把53号数据文件已经清空了,但还是报上面的错

    1. select * from dba_extents where file_id=53

    诊断结论:ASSM 管理模式下dba_extents是存放在数据文件中的,脱机文件是看不到对象的。因为你这种报错说明53号文件还是有对象存在的,原则上是可以跳过这些对象导出正常的对象的,要确认53号的对象需要使用如下SQL。



    问题八、oracle 10G 建立dblink 访问9i的远程库执行sql很慢


    oracle 10G 建立了dblink 连接9i 数据库 执行了 select * from table --table中只有两条记录 耗时 20s 两台服务器间网络正常 再9i 直接执行sql 很快 还可能是什么原因呢?查看等待事件为 SQL*Net message from dblink

    诊断结论:是因为 10g 的服务器操作系统版本是 windows server 2012   从windows server 2008 以后 增加了 接收窗口自动调谐级别 功能导致,调整接收窗口自动调谐级别解决。



    问题九、安装rac,IO有什么要求?


    安装rac,IO有什么要求么?参考过 rac安装有最佳实践,但是官方并没有指出IO具体参考范围(IOPS)。所以,想咨询下,贵司有没有针对RAC安装对IO的要求或IO范围参考值?我想对比下自己的存储IO性能,看是否达标。

    诊断结论:是因为 10g 的服务器操作系统版本是 windows server 2012   从windows server 2008 以后 增加了 接收窗口自动调谐级别 功能导致,调整接收窗口自动调谐级别解决。



    问题十、双机切换后TNS-12537 ORA-609


    数据库是Oracle,操作系统是Windows,高可用是rose双机。把主服务器切换到备用服务器时,会出现程序连接不上,报错如下:

    但是切回来以后就正常了,经过查看日志,发现如下报错:

    1. Fatal NI connect error 12537, connecting to:

    2. (LOCAL=NO)

    3. VERSION INFORMATION:

    4. TNS for 64-bit Windows: Version 11.2.0.1.0 - Production

    5. Oracle Bequeath NT Protocol Adapter for 64-bit Windows: Version 11.2.0.1.0 - Production

    6. Windows NT TCP/IP NT Protocol Adapter for 64-bit Windows: Version 11.2.0.1.0 - Production

    7. Time: 12-3月 -2019 20:15:08

    8. Tracing not turned on.

    9. Tns error struct:

    10. ns main err code: 12537


    11. TNS-12537: TNS: 连接关闭

    12. ns secondary err code: 12560

    13. nt main err code: 0

    14. nt secondary err code: 0

    15. nt OS err code: 0

    16. opiodr aborting process unknown ospid (10796) as a result of ORA-609

    17. Tue Mar 12 20:15:28 2019

    请问是什么原因导致的呢?怎么去解决这个问题呢

    诊断结论:检查双机各自监听日志,发现节点监听日志4G,清空问题节点监听日志问题解决。



    问题十一、oracle 导入数据报ORA-39242错误


    提示由于表属性原因,无法导入入成功

    1. ORA-39242: Unable to export/import TABLE_DATA: … due to table attributes.

    诊断结论:检查表上面索引的状态是否正常,如果不是VALID就做下rebuild再导入


    出处:恩墨云服务(ID:enmocs)


    往期精彩


    1. DBASK问答集萃第二期

    2. DBASK数据库提问平台问题集萃,首批近二十位专家团曝光


    公司简介  | 招聘 | DTCC | 数据技术嘉年华 | 免费课程 | 入驻华为严选商城

      640?wx_fmt=jpeg

    zCloud | SQM | Bethune Pro2 zData一体机 | Mydata一体机 | ZDBM 备份一体机

    640?wx_fmt=jpeg

    Oracle技术架构 | 免费课程 | 数据库排行榜 | DBASK问题集萃 | 技术通讯 

    640?wx_fmt=jpeg

    升级迁移 | 性能优化 | 智能整合 安全保障 |  架构设计 | SQL审核 | 分布式架构 | 高可用容灾 | 运维代维

    云和恩墨大讲堂 | 一个分享交流的地方

    长按,识别二维码,加入万人交流社群


    640?wx_fmt=jpeg

    请备注:云和恩墨大讲堂

  • 相关阅读:
    关于input()
    HDU 3746
    HDU 4335 Contest 4
    HDU 4418 高斯消元法求概率DP
    HDU 4339 Contest 4
    HDU 4334 Contest 4
    HDU 4333 Contest 4
    HDU 4332 Contest 4
    HDU 4035
    HDU 4336
  • 原文地址:https://www.cnblogs.com/hzcya1995/p/13312068.html
Copyright © 2011-2022 走看看