zoukankan      html  css  js  c++  java
  • Linux系统环境下的Socket编程详细解析

    来自: http://blog.163.com/jiangh_1982/blog/static/121950520082881457775/

      什么是Socket

      Socket接口是TCP/IP网络的APISocket接口定义了许多函数或例程,程序员可以用它们来开发TCP/IP网络上的应用程序。要学Internet上的TCP/IP网络编程,必须理解Socket接口。

      Socket接口设计者最先是将接口放在Unix操作系统里面的。如果了解Unix系统的输入和输出的话,就很容易了解Socket了。网络的Socket数据传输是一种特殊的I/OSocket也是一种文件描述符。Socket也具有一个类似于打开文件的函数调用Socket(),该函数返回一个整型的Socket描述符,随后的连接建立、数据传输等操作都是通过该Socket实现的。常用的Socket类型有两种:流式SocketSOCK_STREAM)和数据报式SocketSOCK_DGRAM)。流式是一种面向连接的Socket,针对于面向连接的TCP服务应用;数据报式Socket是一种无连接的Socket,对应于无连接的UDP服务应用。

      Socket建立

      为了建立Socket,程序可以调用Socket函数,该函数返回一个类似于文件描述符的句柄。socket函数原型为:

    int socket(int domain, int type, int protocol);

      domain指明所使用的协议族,通常为PF_INET,表示互联网协议族(TCP/IP协议族);type参数指定socket的类型:SOCK_STREAM SOCK_DGRAMSocket接口还定义了原始SocketSOCK_RAW),允许程序使用低层协议;protocol通常赋值"0"Socket()调用返回一个整型socket描述符,你可以在后面的调用使用它。

      Socket描述符是一个指向内部数据结构的指针,它指向描述符表入口。调用Socket函数时,socket执行体将建立一个Socket,实际上"建立一个Socket"意味着为一个Socket数据结构分配存储空间。Socket执行体为你管理描述符表。

      两个网络程序之间的一个网络连接包括五种信息:通信协议、本地协议地址、本地主机端口、远端主机地址和远端协议端口。Socket数据结构中包含这五种信息。

      Socket配置

      通过socket调用返回一个socket描述符后,在使用socket进行网络传输以前,必须配置该socket。面向连接的socket客户端通过调用Connect函数在socket数据结构中保存本地和远端信息。无连接socket的客户端和服务端以及面向连接socket的服务端通过调用bind函数来配置本地信息。

      Bind函数将socket与本机上的一个端口相关联,随后你就可以在该端口监听服务请求。Bind函数原型为:

    /*

     * Sockfd是调用socket函数返回的socket描述符,

     * my_addr是一个指向包含有本机IP地址及端口号等信息的sockaddr类型的指针;

     * addrlen常被设置为sizeof(struct sockaddr)

     */

    int bind(int sockfd,struct sockaddr *my_addr, int addrlen);
    sockaddr结构类型是用来保存socket信息的:

      struct sockaddr {

        unsignedshort sa_family; /* 地址族, AF_xxx */

        char sa_data[14]; /* 14 字节的协议地址 */

        };
      sa_family一般为AF_INET,代表InternetTCP/IP)地址族;sa_data则包含该socketIP地址和端口号。

      另外还有一种结构类型:
      struct sockaddr_in {

          shortintsin_family/* 地址族 */

          unsignedshortintsin_port/* 端口号 */

          struct in_addr sin_addr/* IP地址 */

          unsignedcharsin_zero[8]; /* 填充以保持与struct sockaddr同样大小 */

          };

      这个结构更方便使用。sin_zero用来将sockaddr_in结构填充到与struct sockaddr同样的长度,可以用bzero()memset()函数将其置为零。指向sockaddr_in 的指针和指向sockaddr的指针可以相互转换,这意味着如果一个函数所需参数类型是sockaddr时,你可以在函数调用的时候将一个指向sockaddr_in的指针转换为指向sockaddr的指针;或者相反。

      使用bind函数时,可以用下面的赋值实现自动获得本机IP地址和随机获取一个没有被占用的端口号:

          my_addr.sin_port = 0; /* 系统随机选择一个未被使用的端口号 */

          my_addr.sin_addr.s_addr = INADDR_ANY; /* 填入本机IP地址 */

    通过将my_addr.sin_port置为0,函数会自动为你选择一个未占用的端口来使用。同样,通过将my_addr.sin_addr.s_addr置为INADDR_ANY,系统会自动填入本机IP地址。

      注意在使用bind函数是需要将sin_portsin_addr转换成为网络字节优先顺序;而sin_addr则不需要转换。

      计算机数据存储有两种字节优先顺序:高位字节优先和低位字节优先。Internet上数据以高位字节优先顺序在网络上传输,所以对于在内部是以低位字节优先方式存储数据的机器,在Internet上传输数据时就需要进行转换,否则就会出现数据不一致。

      下面是几个字节顺序转换函数:

    ·htonl():把32位值从主机字节序转换成网络字节序
    ·htons():把16位值从主机字节序转换成网络字节序
    ·ntohl():把32位值从网络字节序转换成主机字节序
    ·ntohs():把16位值从网络字节序转换成主机字节序

      Bind()函数在成功被调用时返回0;出现错误时返回"-1"并将errno置为相应的错误号。需要注意的是,在调用bind函数时一般不要将端口号置为小于1024的值,因为11024是保留端口号,你可以选择大于1024中的任何一个没有被占用的端口号。

      连接建立

      面向连接的客户程序使用Connect函数来配置socket并与远端服务器建立一个TCP连接,其函数原型为:

        int connect(int sockfd, struct sockaddr *serv_addr,int addrlen);

      Sockfdsocket函数返回的socket描述符;serv_addr是包含远端主机IP地址和端口号的指针;addrlen是远端地址结构的长度。Connect函数在出现错误时返回-1,并且设置errno为相应的错误码。进行客户端程序设计无须调用bind(),因为这种情况下只需知道目的机器的IP地址,而客户通过哪个端口与服务器建立连接并不需要关心,socket执行体为你的程序自动选择一个未被占用的端口,并通知你的程序数据什么时候打开端口。

      Connect函数启动和远端主机的直接连接。只有面向连接的客户程序使用socket时才需要将此socket与远端主机相连。无连接协议从不建立直接连接。面向连接的服务器也从不启动一个连接,它只是被动的在协议端口监听客户的请求。

      Listen函数使socket处于被动的监听模式,并为该socket建立一个输入数据队列,将到达的服务请求保存在此队列中,直到程序处理它们。

        int listen(int sockfdint backlog);

      SockfdSocket系统调用返回的socket 描述符;backlog指定在请求队列中允许的最大请求数,进入的连接请求将在队列中等待accept()它们(参考下文)。Backlog对队列中等待服务的请求的数目进行了限制,大多数系统缺省值为20。如果一个服务请求到来时,输入队列已满,该socket将拒绝连接请求,客户将收到一个出错信息。

      当出现错误时listen函数返回-1,并置相应的errno错误码。

      accept()函数让服务器接收客户的连接请求。在建立好输入队列后,服务器就调用accept函数,然后睡眠并等待客户的连接请求。

          int accept(int sockfd, void *addr, int *addrlen);

      sockfd是被监听的socket描述符,addr通常是一个指向sockaddr_in变量的指针,该变量用来存放提出连接请求服务的主机的信息(某台主机从某个端口发出该请求);addrlen通常为一个指向值为sizeof(struct sockaddr_in)的整型指针变量。出现错误时accept函数返回-1并置相应的errno值。

      首先,当accept函数监视的socket收到连接请求时,socket执行体将建立一个新的socket,执行体将这个新socket和请求连接进程的地址联系起来,收到服务请求的初始socket仍可以继续在以前的 socket上监听,同时可以在新的socket描述符上进行数据传输操作。

      数据传输

      Send()recv()这两个函数用于面向连接的socket上进行数据传输。

      Send()函数原型为:

          int send(int sockfd, constvoid *msg, int len, int flags);

      Sockfd是你想用来传输数据的socket描述符;msg是一个指向要发送数据的指针;Len是以字节为单位的数据的长度;flags一般情况下置为0(关于该参数的用法可参照man手册)。

      Send()函数返回实际上发送出的字节数,可能会少于你希望发送的数据。在程序中应该将send()的返回值与欲发送的字节数进行比较。当send()返回值与len不匹配时,应该对这种情况进行处理。

          char *msg = "Hello!";

          int len, bytes_sent;

          ……

          len = strlen(msg);

          bytes_sent = send(sockfd, msg,len,0);

          ……

      recv()函数原型为:

          int recv(int sockfd,void *buf,int len,unsignedint flags);

      Sockfd是接受数据的socket描述符;buf 是存放接收数据的缓冲区;len是缓冲的长度。Flags也被置为0Recv()返回实际上接收的字节数,当出现错误时,返回-1并置相应的errno值。

      Sendto()recvfrom()用于在无连接的数据报socket方式下进行数据传输。由于本地socket并没有与远端机器建立连接,所以在发送数据时应指明目的地址。

      Sendto()函数原型为:

          int sendto(int sockfd, constvoid *msg,int len,unsignedint flags,conststruct sockaddr *to, int tolen);

      该函数比send()函数多了两个参数,to表示目地机的IP地址和端口号信息,而tolen常常被赋值为sizeof (struct sockaddr)Sendto 函数也返回实际发送的数据字节长度或在出现发送错误时返回-1

      Recvfrom()函数原型为:

          int recvfrom(int sockfd,void *buf,int len,unsignedint flags,struct sockaddr *from,int *fromlen);

      from是一个struct sockaddr类型的变量,该变量保存源机的IP地址及端口号。fromlen常置为sizeof (struct sockaddr)。当recvfrom()返回时,fromlen包含实际存入from中的数据字节数。Recvfrom()函数返回接收到的字节数或当出现错误时返回

      1,并置相应的errno

      如果你对数据报socket调用了connect()函数时,你也可以利用send()recv()进行数据传输,但该socket仍然是数据报socket,并且利用传输层的UDP服务。但在发送或接收数据报时,内核会自动为之加上目地和源地址信息。

      结束传输

      当所有的数据操作结束以后,你可以调用close()函数来释放该socket,从而停止在该socket上的任何数据操作:

    close(sockfd);

      你也可以调用shutdown()函数来关闭该socket。该函数允许你只停止在某个方向上的数据传输,而一个方向上的数据传输继续进行。如你可以关闭某socket的写操作而允许继续在该socket上接受数据,直至读入所有数据。

          int shutdown(int sockfd,int how);

      Sockfd是需要关闭的socket的描述符。参数 how允许为shutdown操作选择以下几种方式:

      ·0-------不允许继续接收数据

      ·1-------不允许继续发送数据

      ·2-------不允许继续发送和接收数据,

      ·均为允许则调用close ()

     

      shutdown在操作成功时返回0,在出现错误时返回-1并置相应errno

      面向连接的Socket实例

      代码实例中的服务器通过socket连接向客户端发送字符串"Hello, you are connected!"。只要在服务器上运行该服务器软件,在客户端运行客户软件,客户端就会收到该字符串。

    该服务器软件代码如下:

    /*下面这段代码仅供参考,应该是运行不了 */

    #include<stdio.h>

    #include<sys/socket.h>

    #include<unistd.h>

    #include<sys/types.h>

    #include<netinet/in.h>

    #include<stdlib.h>

    #include<time.h>

    #define SERVPORT 3333 /*服务器监听端口号 */

    #define BACKLOG 10 /* 最大同时连接请求数 */

    #define TRUE 1

    int main() {

        int sockfd, client_fd; /*sock_fd:监听socketclient_fd:数据传输socket */

        struct sockaddr_in my_addr; /* 本机地址信息 */

        struct sockaddr_in remote_addr; /* 客户端地址信息 */

        if ((sockfd = socket(AF_INET, SOCK_STREAM, 0)) == -1) {//建立socket

           perror("socket创建出错!");

           exit(1);

        }

        my_addr.sin_family=AF_INET;

        //htonl():把32位值从主机字节序转换成网络字节序,

        //htons():把16位值从主机字节序转换成网络字节序,

        //用的时候应该改成前面的函数

        my_addr.sin_port=htons(SERVPORT);

        my_addr.sin_addr.s_addr = INADDR_ANY;

        bzero(&(my_addr.sin_zero), 8);

        //socket与本机一个端口关联

        if (bind(sockfd, (struct sockaddr *)&my_addr, sizeof(struct sockaddr))== -1) {

           perror("bind出错!");

           exit(1);

        }

        //listen函数使socket处于被动的监听模式,并为该socket建立一个输入数据队列,

        //将到达的服务请求保存在此队列中,直到程序处理它们。

        if (listen(sockfd, BACKLOG) == -1) {

           perror("listen出错!");

           exit(1);

        }

        while (TRUE) {

           //这里这个sin_size应该定义一下

           //int sin_size;

           sin_size = sizeof(struct sockaddr_in);

    //accept()函数让服务器接收客户的连接请求,产生一个新的用于数据传输socket

           if ((client_fd = accept(sockfd, (struct sockaddr *)&remote_addr,

                  &sin_size)) == -1) {

               perror("accept出错");

               continue;

           }

           //inet_ntoa将网络二进制的数字转换成网络地址

           printf("received a connection from %s", inet_ntoa(remote_addr.sin_addr));

           //这段代码写的太猛,这是一个用子进程处理事件的过程,子进程只做了受到消息向客户端返回一个确认

           //创建一个进程之后第一件事情是要判断这个进程是哪个进程,是子进程还是父进程

           if (!fork()) { //子进程代码段,返回0为子进程,下面处理的就是子进程.

               if (send(client_fd, "Hello, you are connected!", 26, 0) == -1)

                  perror("send出错!");

               close(client_fd);

               /**

                * 相关函数:_exit, atexit, on_exit

                * 表头文件:#include <stdlib.h>

                * 函数定义:void exit(int status);

                * 函数说明:exit()用来正常终结目前进程的执行,并把参数status返回给父进程,

                * 而进程所有的缓冲区数据会自动写回并关闭未关闭的文件。

                * 返回值 :无

                */

               exit(0);//子进程正常结束

           }

           close(client_fd);

        }

        return 0;

    }

     

      服务器的工作流程是这样的:首先调用socket函数创建一个Socket,然后调用bind函数将其与本机地址以及一个本地端口号绑定,然后调用listen在相应的socket上监听,当accpet接收到一个连接服务请求时,将生成一个新的socket。服务器显示该客户机的IP地址,并通过新的socket向客户端发送字符串"Helloyou are connected!"。最后关闭该socket

      代码实例中的fork()函数生成一个子进程来处理数据传输部分,fork()语句对于子进程返回的值为0。所以包含fork函数的if语句是子进程代码部分,它与if语句后面的父进程代码部分是并发执行的。

      客户端程序代码如下:

    #include<stdio.h>

    #include<sys/socket.h>

    #include<unistd.h>

    #include<sys/types.h>

    #include<netinet/in.h>

    #include<stdlib.h>

    #include<time.h>

    #define SERVPORT 3333 /*下面这段代码仅供参考,应该是运行不了 */

    #define BACKLOG 10 /* 最大同时连接请求数 */

    #define TRUE 1

    int main() {

        int sockfd, client_fd; /*sock_fd:监听socketclient_fd:数据传输socket */

        struct sockaddr_in my_addr; /* 本机地址信息 */

        struct sockaddr_in remote_addr; /* 客户端地址信息 */

        if ((sockfd = socket(AF_INET, SOCK_STREAM, 0)) == -1) {//建立socket

           perror("socket创建出错!");

           exit(1);

        }

        my_addr.sin_family=AF_INET;

        //htonl():把32位值从主机字节序转换成网络字节序,

        //htons():把16位值从主机字节序转换成网络字节序,

        //用的时候应该改成前面的函数

        my_addr.sin_port=htons(SERVPORT);

        my_addr.sin_addr.s_addr = INADDR_ANY;

        bzero(&(my_addr.sin_zero), 8);

        //socket与本机一个端口关联

        if (bind(sockfd, (struct sockaddr *)&my_addr, sizeof(struct sockaddr))== -1) {

           perror("bind出错!");

           exit(1);

        }

        //listen函数使socket处于被动的监听模式,并为该socket建立一个输入数据队列,

        //将到达的服务请求保存在此队列中,直到程序处理它们。

        if (listen(sockfd, BACKLOG) == -1) {

           perror("listen出错!");

           exit(1);

        }

        while (TRUE) {

           //这里这个sin_size应该定义一下

           //int sin_size;

           sin_size = sizeof(struct sockaddr_in);

           //accept()函数让服务器接收客户的连接请求,这是产生了一个新的socket

           //就是数据传输socket

           if ((client_fd = accept(sockfd, (struct sockaddr *)&remote_addr,

                  &sin_size)) == -1) {

               perror("accept出错");

               continue;

           }

           //inet_ntoa将网络二进制的数字转换成网络地址

           printf("received a connection from %s", inet_ntoa(remote_addr.sin_addr));

           //这段代码写的太猛,这是一个用子进程处理事件的过程,子进程只做了受到消息向客户端返回一个确认

           //创建一个进程之后第一件事情是要判断这个进程是哪个进程,是子进程还是父进程

           if (!fork()) { //子进程代码段,返回0为子进程,下面处理的就是子进程.

               if (send(client_fd, "Hello, you are connected!", 26, 0) == -1)

                  perror("send出错!");

               close(client_fd);

               /**

                * 相关函数:_exit, atexit, on_exit

                * 表头文件:#include <stdlib.h>

                * 函数定义:void exit(int status);

                * 函数说明:exit()用来正常终结目前进程的执行,并把参数status返回给父进程,

                * 而进程所有的缓冲区数据会自动写回并关闭未关闭的文件。

                * 返回值 :无

                */

               exit(0);//子进程正常结束

           }

           close(client_fd);

        }

        return 0;

    }

     

      客户端程序首先通过服务器域名获得服务器的IP地址,然后创建一个socket,调用connect函数与服务器建立连接,连接成功之后接收从服务器发送过来的数据,最后关闭socket

      函数gethostbyname()是完成域名转换的。由于IP地址难以记忆和读写,所以为了方便,人们常常用域名来表示主机,这就需要进行域名和IP地址的转换。函数原型为:

      struct hostent *gethostbyname(constchar *name);
    函数返回为hosten的结构类型,它的定义如下:
    struct hostent {

        char *h_name/* 主机的官方域名 */

        char **h_aliases/* 一个以NULL结尾的主机别名数组 */

        inth_addrtype/* 返回的地址类型,在Internet环境下为AF-INET */

        inth_length/* 地址的字节长度 */

        char **h_addr_list/* 一个以0结尾的数组,包含该主机的所有地址*/

    };

    #define h_addr h_addr_list[0] /*h-addr-list中的第一个地址*/

      当 gethostname()调用成功时,返回指向struct hosten的指针,当调用失败时返回-1。当调用gethostbyname时,你不能使用perror()函数来输出错误信息,而应该使用herror()函数来输出。

      无连接的客户/服务器程序的在原理上和连接的客户/服务器是一样的,两者的区别在于无连接的客户/服务器中的客户一般不需要建立连接,而且在发送接收数据时,需要指定远端机的地址。

      阻塞和非阻塞

      阻塞函数在完成其指定的任务以前不允许程序调用另一个函数。例如,程序执行一个读数据的函数调用时,在此函数完成读操作以前将不会执行下一程序语句。当服务器运行到accept语句时,而没有客户连接服务请求到来,服务器就会停止在accept语句上等待连接服务请求的到来。这种情况称为阻塞(blocking)。而非阻塞操作则可以立即完成。比如,如果你希望服务器仅仅注意检查是否有客户在等待连接,有就接受连接,否则就继续做其他事情,则可以通过将Socket设置为非阻塞方式来实现。非阻塞socket在没有客户在等待时就使accept调用立即返回。

    #include

    #include

    ……

    sockfd = socket(AF_INET, SOCK_STREAM, 0);

    fcntl(sockfd,F_SETFL,O_NONBLOCK)

    ……

      通过设置socket为非阻塞方式,可以实现"轮询"若干Socket。当企图从一个没有数据等待处理的非阻塞Socket读入数据时,函数将立即返回,返回值为-1,并置errno值为EWOULDBLOCK。但是这种"轮询"会使CPU处于忙等待方式,从而降低性能,浪费系统资源。而调用select()会有效地解决这个问题,它允许你把进程本身挂起来,而同时使系统内核监听所要求的一组文件描述符的任何活动,只要确认在任何被监控的文件描述符上出现活动,select()调用将返回指示该文件描述符已准备好的信息,从而实现了为进程选出随机的变化,而不必由进程本身对输入进行测试而浪费CPU开销。Select函数原型为:

    int select(int numfds,fd_set *readfds,fd_set *writefds,

    fd_set *exceptfds,struct timeval *timeout);

      其中readfdswritefdsexceptfds分别是被select()监视的读、写和异常处理的文件描述符集合。如果你希望确定是否可以从标准输入和某个socket描述符读取数据,你只需要将标准输入的文件描述符0和相应的sockdtfd加入到readfds集合中;numfds的值是需要检查的号码最高的文件描述符加1,这个例子中numfds的值应为sockfd+1;当select返回时,readfds将被修改,指示某个文件描述符已经准备被读取,你可以通过FD_ISSSET()来测试。为了实现fd_set中对应的文件描述符的设置、复位和测试,它提供了一组宏:

      FD_ZERO(fd_set *set)----清除一个文件描述符集;

      FD_SET(int fd,fd_set *set)----将一个文件描述符加入文件描述符集中;

      FD_CLR(int fd,fd_set *set)----将一个文件描述符从文件描述符集中清除;

      FD_ISSET(int fd,fd_set *set)----试判断是否文件描述符被置位。

      Timeout参数是一个指向struct timeval类型的指针,它可以使select()在等待timeout长时间后没有文件描述符准备好即返回。struct timeval数据结构为:

    struct timeval {

     inttv_sec/* seconds */

     inttv_usec/* microseconds */ };

    POP3客户端实例

    (小呆:我怎么没发现这个实例存在的意义。)

      下面的代码实例基于POP3的客户协议,与邮件服务器连接并取回指定用户帐号的邮件。与邮件服务器交互的命令存储在字符串数组POPMessage中,程序通过一个do-while循环依次发送这些命令。

    #include<stdio.h>

    #include<sys/socket.h>

    #include<unistd.h>

    #include<sys/types.h>

    #include<netinet/in.h>

    #include<stdlib.h>

    #include<time.h>

    #define POP3SERVPORT 110

    #define MAXDATASIZE 4096

    int main(int argc, char *argv[]) {

        int sockfd;

        struct hostent *host;

        struct sockaddr_in serv_addr;

        char *POPMessage[]= { "USER userid""PASS password""STAT""LIST",

               "RETR 1""DELE 1""QUIT", NULL };

        int iLength;

        int iMsg=0;

        int iEnd=0;

        char buf[MAXDATASIZE];

        if ((host=gethostbyname("your.server"))==NULL) {

           perror("gethostbyname error");

           exit(1);

        }

        if ((sockfd = socket(AF_INET, SOCK_STREAM, 0)) == -1) {

           perror("socket error");

           exit(1);

        }

        serv_addr.sin_family=AF_INET;

        serv_addr.sin_port=htons(POP3SERVPORT);

        serv_addr.sin_addr = *((struct in_addr *)host->h_addr);

        bzero(&(serv_addr.sin_zero), 8);

        if (connect(sockfd, (struct sockaddr *)&serv_addr, sizeof(struct sockaddr))

               ==-1) {

           perror("connect error");

           exit(1);

        }

        do {

           send(sockfd, POPMessage[iMsg], strlen(POPMessage[iMsg]), 0);

           printf("have sent: %s", POPMessage[iMsg]);

           iLength=recv(sockfd, buf+iEnd, sizeof(buf)-iEnd,0);

           iEnd+=iLength;

           buf[iEnd]='';

           printf("received: %s,%d

           ",buf,iMsg);

           iMsg++;

        }while (POPMessage[iMsg]);

        close(sockfd);

        return 0;

    }

  • 相关阅读:
    使用Razor模板构建应用注意的细节
    分享一个秒计数器
    有效提高命中率的缓存设计
    伟大的C语言
    关于在使用Visual C++中使用MMX、SSE指令集的问题
    如何用SVN 或 WINCVS 下载x264 ffdshow T264 Kevinlib
    Visual C++图形特技
    图象处理部分文章列表
    C++,VC资源
    Visual C++ 如何:在各种字符串类型之间进行转换
  • 原文地址:https://www.cnblogs.com/wolflion/p/2539142.html
Copyright © 2011-2022 走看看