#include "unp.h" int connect_nonb(int sockfd, const SA *saptr, socklen_t salen, int nsec) { int flags, n, error; socklen_t len; fd_set rset, wset; struct timeval tval; flags = fcntl(sockfd, F_GETFL, 0); fcntl(sockfd, F_SETFL, flags | O_NONBLOCK); error = 0; if ( (n = connect(sockfd, saptr, salen)) < 0)//连接不能立即建立,已经发起的三次握手继续进行,同时返回-1,errno设置为EINPROGRESS if (errno != EINPROGRESS) return(-1); /* Do whatever we want while the connect is taking place. */ if (n == 0)//返回成功,连接能够立即建立 goto done; /* connect completed immediately */ FD_ZERO(&rset); FD_SET(sockfd, &rset); wset = rset; tval.tv_sec = nsec; tval.tv_usec = 0; if ( (n = select(sockfd+1, &rset, &wset, NULL, nsec ? &tval : NULL)) == 0) { close(sockfd); /* timeout */ errno = ETIMEDOUT; return(-1); } if (FD_ISSET(sockfd, &rset) || FD_ISSET(sockfd, &wset)) { len = sizeof(error); if (getsockopt(sockfd, SOL_SOCKET, SO_ERROR, &error, &len) < 0)//error返回0,表示在等待的时间内连接建立;如果非零,表示连接建立遇到了套接字错误而导致的套接字可读可写 return(-1); /* Solaris pending error */ } else err_quit("select error: sockfd not set"); done: fcntl(sockfd, F_SETFL, flags); /* restore file status flags */ if (error) { close(sockfd); /* just in case */ errno = error; return(-1); } return(0); }
注意:前面有关于由于连接套接字错误导致套接字可读可写的代码说明:<<UNIX网络编程——使用select 实现套接字I/O超时>>里面的connect_timeout函数。
设置套接字为非阻塞
11-12 调用fcntl把套接字设置为非阻塞
14-17 发起非阻塞connect。期望的错误是EINPROGRESS,表示连接建立已经启动但是尚未完成。connect返回的任何其他错误返回给本函数的调用者。
在其他处理上迭合连接建立
19 至此我们可以在等待连接建立完成期间做任何我们想做的事情。
检查连接是否立即建立
21-22 如果非阻塞connect返回0。那么连接已经建立。我们已经说过,当服务器处于客户所在主机时这种情况可能发生。
调用select
24-31 调用select等待套接字变为可读或可写。我们清零rset,打开这个描述符集中对应sockfd的位,然后将rset复制到wset。复制描述集的赋值可能是一个结构赋值,因为描述符集通常作为结构表示。我们还初始化timeval结构,然后调用select。如果调用者把第四个参数指定为0(表示使用默认超时时间),那么我们必须把select的最后一个参数指定为一个空指针,而不是一个值为0的timeval结构。注意:套接字建立连接遇到错误,将使得套接字可读可写。这时select也返回成功。
处理超时
32-35 如果select返回0,那么超时发生,我们于是返回ETIMEOUT错误给调用者。我们还要关闭套接字,以防止已经启动的三次握手继续下去。
检查可读或可写条件
37-42 如果描述符变为可读或可写,我们就调用getsockopt取得套接字的待处理错误(使用SO_ERROR套接字选项)。如果连接成功建立,error将为0.如果连接建立发生错误,该值就是对应连接错误的errno值(譬如ECONNREFUSED,ETIMEDOUT等)。套接字建立连接遇到错误,将使得套接字可读可写。连接建立成功的话,套接字变为可写。这里我们会遇到第一个移植性问题。如果发生错误,getsockopt源自Berkeley的实现将在我们的变量error中返回待处理错误,getsockopt本身返回0;然而Solaris却让getsockopt返回-1,并把errno变量置为待处理错误。不过我们的程序能够同时处理这两种情况。
关闭非阻塞状态并返回
45-52 恢复套接字的文件状态标志并返回。如果自getsockopt返回的error变量为非0值,我们就把该值存入errno,函数本身返回-1。
套接字的各种实现以及非阻塞connect会带来移植性问题。首先,调用select之前有可能连接已经建立并有来自对端的数据到达。这种情况下即使套接字上不发生错误,套接字也是既可读又可写,这和连接建立失败情况下套接字的读写条件一样。上面代码中通过调用getsockopt并检查套接字上是否存在待处理错误来处理这种情形。
其次,既然我们不能假设套接字的可写(而不可读)条件时select返回套接字操作成功条件的唯一方法,下一个移植性问题就是怎么判断连接建立是否成功。以下是各种取代使用getsockopt的解决办法:(这里用getsockopt也是可以的,通过使用SO_ERROR套接字选项看error为0,表示连接建立,非零表示建立连接套接字错误)
- 调用getpeername代替getsockopt。如果getpeername以ENOTCNN错误失败返回,那么连接建立已经失败,我们必须接着以SO_ERROR调用getsockopt取得套接字上待处理的错误。
- 以值为0的长度参数调用read。如果read失败,那么connect已经失败,read返回的errno给出了连接失败的原因。如果连接建立成功,那么read应该返回0。
- 再调用connect一次。它应该失败,如果错误是EISCONN,那么套接字已经连接,也就是说第一次连接已经成功。
不幸的是,非阻塞connect是网络编程中最不易移植的部分。使用该技术必须应付移植性问题,特别是对于较老的实现。避免移植性问题的一个较简单技术是为每个连接创建一个处理线程。
被中断的connect
前面的博客有说明:<<UNIX网络编程——并发服务器(TCP)>>
对于一个正常的阻塞式套接字,如果其上的connect调用在TCP三次握手完成前被中断(譬如说捕获了某个信号),将会发生什么呢?假设被中断的connect调用不由内核自动重启,那么它将返回EINTR。我们不能再次调用connect等待未完成的连接继续完成。这样做将导致返回EADDRINUSE错误。
这种情形下我们只能调用select,就像本节对于阻塞connect所做的那样。连接建立成功时select返回套接字可写条件,连接建立失败时select返回套接字可读又可写条件。