文章转自:http://www.luocs.com/archives/464.html
此文版权归作者 – yaogang所有,转载请注明yaogang©www.luocs.com。
Luocs说:这是我一个朋友的一个监听器问题解决案例,这是昨天发生的事情,我一直跟朋友一起Troubleshooting,折腾了半天最后是BUG所致。再次汗颜,Windows平台惹不起啊!好,那么下面开始分享我朋友的案例!
环境描述:
OS : Windows Server 2008 64Bit (做了HA)
DB : 11.1.0.7.0
排错过程:
前天应用不能访问数据库了 (后台应用能访问数据库),故障发生。
马上登录到服务器里查看监听状态,发现有TNS-12541 ,TNS-12560等错误
Luocs补充:我跟朋友要了错误代码,但他没有保存,就直接贴图。
从计算器的管理 –> 服务选项 –> 检查oracle 监听服务程序,发现该服务已经停止。
手动把监听服务启动,这时候服务状态上显示为已启动,但在CMD窗口执行lsnrctl status的时候依然返回错误信息:
C:>lsnrctl status
LSNRCTL for 64-bit Windows: Version 11.1.0.7.0 - Production on 12-11月-2012 18:1
8:32
Copyright (c) 1991, 2008, Oracle. All rights reserved.
正在连接到 (DESCRIPTION=(ADDRESS=(PROTOCOL=TCP)(HOST=10.10.203.218)(PORT=1521)))
TNS-12541: TNS: 无监听程序
TNS-12560: TNS: 协议适配器错误
TNS-00511: 无监听程序
64-bit Windows Error: 61: Unknown error
正在连接到 (DESCRIPTION=(ADDRESS=(PROTOCOL=IPC)(KEY=EXTPROC1521)))
过段时间回显非常慢。
然后我检查了下告警日志,大量的ora错误
Fatal NI connect error 12170.
VERSION INFORMATION:
TNS for 64-bit Windows: Version 11.1.0.7.0 - Production
Oracle Bequeath NT Protocol Adapter for 64-bit Windows: Version 11.1.0.7.0 - Production
Windows NT TCP/IP NT Protocol Adapter for 64-bit Windows: Version 11.1.0.7.0 - Production
Time: 12-11月-2012 15:23:33
Tracing not turned on.
Tns error struct:
ns main err code: 12535
TNS-12535: TNS: 操作超时
ns secondary err code: 12560
nt main err code: 0
nt secondary err code: 0
nt OS err code: 0
Client address: <unknown>
ORA-609 : opiodr aborting process unknown ospid (4116_6104)
这时候朋友怀疑是不是监听器配置问题,就把原先的监听器删除重建了下,问题依然。
网上有个解决TNS-12535错误的案例,平台和版本都很类似,如下:
1、在 sqlnet.ora文件中 增加如下行:
DIAG_ADR_ENABLED = OFF
2、在listener.ora文件中增加如下行:
DIAG_ADR_ENABLED_<listenername> = OFF
如何监听是listener时,则前面的名称为:DIAG_ADR_ENABLED_LISTENER = OFF
3、重新启动windows服务管理中的监听程序.先停止,然后再重新启动.
4、检查结果.发现可以了,返回的值在10毫秒.有时为0毫秒.成功!!
但这并不是问题发生原因,在继续排查过程中偶然发现监听日志大小居然为4G。然后把这现象告诉了Luocs。
过了一会儿,Luocs回应是Oracle一个BUG,BUG号为9879101 : THE CONNECT THROUGH LISTENER WAS SLOW WHEN LISTNER LOG GROWED 4GB。
Luocs还提供了MOS上一篇文章,ID 1319797.1 : WINDOWS: Listener Hangs & Lsnrctl Commands Are Slow or Hang,里面给出了解决方法:
You can solve this problem by deleting the large listener in $ORACLE_BASEdiag nslsnr<hostname>listener race<listener_name>.log
1) Stop the listener process using the command line or Control Panel Service.
2) Delete the log file(s) that are at or approaching the 4G size limit at this location:
$ORACLE_BASEdiag nslsnr<hostname>listener race<listener_name>.log
3) Issue any lsnrctl command and you will see a new listener.log in its place under:
$ORACLE_BASEdiag nslsnr<hostname>listener race
Since ADR Diagnostics are enabled for this listener these steps cannot be done dynamically using the lsnrctl utility.
e.g.
LSNRCTL>set log_file mylog
Will yield: TNS-01251: Cannot set trace/log directory under ADR.
However, it is possible to disable the flat file listener logging using the following commands:
LSNRCTL>set current_listener <listener_name>
LSNRCTL>set log_status OFF
LSNRCTL>save_config
我就按照以上说明如下进行:
1)LSNRCTL进入交互模式
2)执行set current_listener LISTENER
3)set log_status off
4)stop 停止监听器
5)手工删除ADR指定的监听日志路径下的listener.log文件
6)start重启监听器
7)status查看状态
到此问题解决。
虽然最后解决过程仅仅耗费了短短几分钟时间,但整个排错过程却是令人惊讶。在此整理,并与遇到同样问题的朋友分享。