zoukankan      html  css  js  c++  java
  • Linux 网络编程基础(1)--网络相关的数据结构及转化函数

      在Linux下进行网络编程,使用的语言一般为C。就个人感受而言,在Linux下进行网络程序的编写,重要的不是代码能力要多强,而是对Linux的网络编程思想的理解和对Linux网络数据结构的掌握。如果想要掌握一般的Linux网络代码编写,首要的任务是理解TCP和UDP协议,要在写代码的时候清晰的知道某段代码的作用是什么,对应的是网络协议哪一个步骤。这样才能够深刻的理解代码,慢慢的写出真正属于自己的代码,而不是人云亦云,亦步亦趋。

      网络相关的数据结构

      当然只是把IPv4和IPv6的常用数据结构总结一下,网络相关的数据结构还是很多的,Unix域的数据结构另外再说。

          首先介绍struct sockaddr、struct sockaddr_in、struct in_addr。

      typedef unsigned short sa_family_t;
      struct sockaddr {
            sa_family_t     sa_family;    /* address family, AF_XXX      */
            char            sa_data[14];    /* 14 bytes of protocol address */

      };

      结构体struct sockaddr定义在/usr/include/linux/socket.h中。

      struct sockaddr_in {
                sa_family_t       sin_family;      /* Address family */
                __be16            sin_port;         /* Port number */
                struct in_addr    sin_addr;        /* Internet address */
                unsigned char     __pad[__SOCK_SIZE__ - sizeof(short int) -
                sizeof(unsigned short int) - sizeof(struct in_addr)];
               /* 字符数组sin_zero[8]的存在是为了保证结构体struct sockaddr_in的大小和结构体struct sockaddr的大小相等 */
      };

        结构体struct sockaddr_in在/usr/include/netinet/in.h中定义。

        struct in_addr{

         unsigned long s_addr;

      };

      in_addr其实就是32bit的IP地址。

      struct sockaddr是通用的套接字地址,而struct sockaddr_in则是internet环境下套接字的地址形式,二者长度一样,都是16个字节。二者是并列结构,指向sockaddr_in结构的指针也可以指向sockaddr。一般情况下,需要把sockaddr_in结构强制转换成sockaddr结构再传入系统调用函数中

      主机字节序和网络字节序

      在介绍上述三个结构体的成员变量之前,先介绍一下字节序。由于网络的特点是将网络上不同的设备和主机进行连接和通信,这就要求开发的网络程序要兼容不同的设备,数据对于设备要有唯一的含义,字节序就是上述问题的典型代表。字节序分为两类:大端字节序和小端字节序。

      小端字节序(Little Endian):将数据的最低字节放在内存的起始位置。特点是内存的低位放置数据的低位。

      大端字节序(Big Endian):将数据的高字节放在内存的起始位置。特点是内存的低位放置数据的高位。与思维习惯不一致,但是与数据的表达是一致的。比如一个四字节的数据0x12345678,起始的内存位置为0x1000;按照大端和小端的存放规范分别是:

        内存地址    0x1000  0x1001  0x1002  0x1003

        小端模式     0x78    0x56    0x34     0x12

        大端模式     0x12    0x34    0x56     0x78

      网络的字节序为大端字节序,所以在进行网络传输前,要将本地的数据转化为网络字节序,到达主机后,再转化为主机字节序。为了完成字节序的转化,Linux提供了一些转化的API,稍候再讨论相关的细节。那要是不知道一台机器的字节序,怎么通过代码来检查此主机的字节序呢?

      结构体  struct sockaddr_in

      重点分析一下sockaddr_in结构体,它是Intnet域网络编程的重要的数据结构之一。一一分析一下词数据结构的成员。

      1、sin_family可以指定当前的网络程序遵循IPv4还是IPv6,经典的赋值方式是:

      struct sockaddr_in skt_addr;

      skt_addr.sin_family = AF_INET;     /*使用IPv4版本*/

      skt_addr.sin_family = AF_INET6;   /*使用IPv6版本*/

      2、sin_port是一个网络字节序的16整型。一定当前的网络程序的端口(此处的端口可以十分简化的理解为:不同网络程序的标记,不同的网络程序使用不同的端口,这样不同网络服务之间就可以进行区分了,当然这种理解是片面)。端口大致可以分为三类:

        1.周知端口(Well Known Ports)

       周知端口是众所周知的端口号,范围从0到1023,其中80端口分配给www服务,21端口分配给FTP服务等。我们在IE的地址栏里输入一个网址的时候是不必  指定端口号的,因为在默认情况下www服务的端口 号是“80”。所以这个范围的端口就不能自己随便用了。

      2.动态端口(Dynamic Ports)

        动态端口的范围是从49152到65535。之所以称为动态端口,是因为它 一般不固定分配某种服务,而是动态分配。动态分配是指当一个系统进程或应用 程序进      程需要网络通信时,它向主机申请一个端口,主机从可用的端口号中分配 一个供它使用。当这个进程关闭时,同时也就释放了所占用的端口号。

      3.注册端口

         端口1024到49151,分配给用户进程或应用程序。这些进程主要是用户选择安装的一些应用程序,而不是已经分配好了公认端口的常用程序。这些端口在没有      被服务器资源占用的时候,可以用用户端动态选用为源端口。

         所以一般情况下自己写程序,使用的都是注册端口。好了,假如我们已经知道我们在IPv4协议下进行通信,使用端口8888,那代码怎么写?

      struct sockaddr_in  skt_addr;

      skt_addr.sin_family = AF_INET;

      skt_addr.sin_port = 8888;     /*这么写就错了,为啥??!!*/

      原因就是我们要保证所有的数据都是网络字节序的。这个时候字节序的转化函数就很有必要了。为了程序设计的方便,

      Linux提供了平台无关的四个字节转换函数:

      #include<arpa/inet.h>

      uint32_t  htonl(uint32_t hostlong);        /*长整型    主机字节序到网络字节序*/

      uint16_t  htons(uint16_t hostlong);        /*短整型   主机字节序到网络字节序*/

      uint32_t  ntohl(uint32_t hostlong);        /*长整型    网络字节序到主机字节序*/

      uint16_t  ntohs(uint16_t hostlong);        /*短整型   网络字节序到主机字节序*/

      所以上面的代码应该这么写:

      struct sockaddr_in  skt_addr;

      skt_addr.sin_family = AF_INET;

      skt_addr.sin_port = htons(8888);     /*这么写就可以了*/

      3、 struct in_addr   sin_addr 这个成员其实我们很熟悉了,非计算机的人也听说过IP地址。这个就是32bit的IP地址。那编程时对这个成员赋与一个点分十  进制的IP地址,就可以使我们的数据在网络上传输了?显然不可以的。

      计算机的存储和人的认知之间是有差距的,“127.0.0.1”这样的IP地址当然是直观的,但是在网络中需要对此数据进行修饰。修饰的函数如下:

      #include<sys/socket.h>

      #include<netinet/in.h>

      #include<arpa/inet.h>

      int inet_aton(const char *cp, struct in_addr *inp);    /*将点分十进制的IP地址转化为in_addr*/

      in_addr_t  inet_addr(const char *cp);                      /*将点分十进制的IP地址转化为in_addr, 不过返回值不一样了*/

      有了网络上的IP,怎么转化为可读的IP地址呢?

      char * inet_ntoa(struct in_addr  in);                        /*将in_addr转化为点分十进制的IP地址*/ 

      其实现在使用的转化函数为inet_ntop()和inet_pton(); 因为这两个函数是可重入的,而且支持多种地址类型。

      int inet_pton(int af, const char *src, void *dst);

      af: 指定地址类型,AF_INET或者INET_INET6

      src: 点分十进制的IP地址

      dst: 转化后的网络IP地址,一般接收到后,使用强制类型转换得到in_addr

      char *inet_ntop(int af, const void *src, char *dst, socklen_t cnt);

      af: 指定地址类型,AF_INET或者INET_INET6

      src: 待转化的网络地址

      dst: 接收点分十进制的IP地址

      cnt:dst的大小,若此值设置过小,会导致ENOSPC错误。

     

      到目前为止,我们可以完整的定义并且初始化一个sockaddr_in 结构体了。

      struct sockaddr_in  skt_addr;

      skt_addr.sin_family = AF_INET;

      skt_addr.sin_port = htons(8888);     /*这么写就可以了*/

      skt_addr.sin_addr = inet_pton("127.0.0.1");

     

      基本的数据结构介绍到此。

      下一篇:获取主机信息、协议处理函数

  • 相关阅读:
    根据访问ip的地区跳转到指定地址
    js生成vCard,以及格式参数详细说明
    min_to_split_multiprocessing多进程,用于平时快速补充数据
    min_to_split.py按日存储到按个股存储
    readzip_minute_data 多进程处理数据
    打包成7zfile,to7zfile
    baostock_multiprocessing 多进程取数据
    终止阻塞线程(有共享锁的线程无效)
    readzip_add_maxL3多线程
    readzip_add_maxL2
  • 原文地址:https://www.cnblogs.com/tju-gsp/p/3652440.html
Copyright © 2011-2022 走看看