zoukankan      html  css  js  c++  java
  • AIO 开始不定时的抛异常: java.io.IOException: 指定的网络名不再可用

    一天里会抛出几个这样的错误,但发现服务还在正常的运行。

    java.io.IOException: 指定的网络名不再可用。

            at sun.nio.ch.Iocp.translateErrorToIOException(Unknown Source)
            at sun.nio.ch.Iocp.access$700(Unknown Source)
            at sun.nio.ch.Iocp$EventHandlerTask.run(Unknown Source)
            at java.lang.Thread.run(Unknown Source)

    在本地用ab进行并发测试的时候,比如: ab -n 2000 -c 200 -k http://xxx/....

    当还没有运行完的时候,按Ctrl + C,服务端程序也会抛出这个异常。

    说明,有可能是在发起TCP(这个可能性大一些)或关闭TCP的时候,握手没有完成。

    由于在windows上,底层用Iocp实现,通过网上搜索:iocp 指定的网络名不再可用,知道了这个错误的iocp错误码:64,然后搜索:iocp 错误 64,找到几篇比较有价值的文章,下面是摘抄的一部分重点:

    来源:http://topic.csdn.net/u/20080606/11/cdaaccab-e4b0-4e67-9194-8107a019a1e9.html

    我们使用完成端口模式编写了一个提供下载的服务器,然后编写了一个测试程序模拟100个客户端来从服务器下载文件,测试程序是通过开启100个线程,以每个线程当作一个客户端来下载文件的,但是测试过程中出现了以下问题:
    经过在多台机器上的测试,只有少数机器出现以下问题,其中最显著的机器网速是10mbps的。
    在成功连接后,文件传输过程中,服务器工作者线程的GetQueuedCompletionStatus处出现了64错误(ERROR_NETNAME_DELETED),但是客户端没有退出也没有任何错误输出,把客户端线程数减少到10个时就不会出现这个问题。
    哪位朋友知道这种问题的原因,请帮忙分析一下吧,谢谢大家了!(如果是不能解决的问题,也得有合理的解释,不然没法和客户解释)


    回复1:
    ERROR_NETNAME_DELETED(64 #错误)在我的测试中是在 client 非正常关闭 TCP 通道时会出现,即关闭的 4 次握手没有正常完成时出现。如果很好的(graceful)完成关闭,比如c/s双方shutdown等, GetQueuedCompletionStatus会成功,会pNumberOfBytes = 0   
      但是很多时候 TCP 通道会非正常关闭,这很正常,所以出现 ERROR_NETNAME_DELETED 也没有什么可怕的。

    回复2:
    这个错误,我也碰到过,分析得到的结论主要还是因为IOCP满负载工作,特别是有众多的未决IO的时候,可能某一个客户端在长时间内得不到影响就会由内核因超时而断掉。建议在这个时候,使用NetStat 查看一下相关的连接状态。

    回复3:
    我再描述一下测试发现的问题的一点规律吧。
    在网速100mbps的机子上基本不出现该问题,基本上总是网速为10mbps的机子出现这个问题。还有就是在10mbps的机子上测试发现,模拟100个至少有20个左右出现问题,随着模拟数降低,出现问题的个数也会减少,减少到20个时,测试10次中只有一次出现了一个该问题,减少到10个时,在测试中没出现过该问题。
    还有就是请大家注意一下,服务器出现64错误时:
    1.客户端使用非阻塞型套接字时,客户端有超时输出
    2.客户端使用阻塞型套接字时,客户端没有相应的输出
    由此我认为服务器出现64错误时客户端并没有退出,而是阻塞住了。


    回复4:
    问题基本已经确定,应该是由于客户端的处理速度太慢,缓冲区总是满的,导致服务器认为对方结束了连接。
    我是这样确定问题的,现在贴出来希望能给大家一些帮助:
    由于iocp的不可控,不方便跟踪,于是服务器端我们采用普通模式,即接到一个连接就开一个线程来处理。然后跟踪调试服务器端,而客户端采用写log的方式来跟踪,最后确定出64错误的连接在服务器端是出现在文件传输过程中的send处,而服务器出64错误的时候,客户端是阻塞在recv处的(我测试时使用的是阻塞型套接字)。
    之后就采用降低服务器发送速度的方式(比如在send前Sleep一下)测试一下,经过多次验证,发现只要服务器发送的速度在客户端的可承受范围内的时候(比如客户端开50个线程的时候服务器Sleep(50),开100个现成的时候就得多Sleep一会),就不会再出现这个问题。

    2012-06-27

  • 相关阅读:
    web中状态码及请求方式
    访问服务器时一直在转圈,等待localhost响应
    Address already in use: JVM_Bind 端口被占用的几个解决办法
    Failed to execute goal org.apache.maven.plugins:maven-clean-plugin:2.5:clean (default-clean)
    taotao商城
    Dubbo的学习
    taotao商城
    sql中有一些保留字,当你的字段名是它的保留字时,这个时候sql语句的字段不加``就会报错
    ssm学习的第一个demo---crm(4)
    ssm学习的第一个demo---crm(3)
  • 原文地址:https://www.cnblogs.com/personnel/p/4583283.html
Copyright © 2011-2022 走看看