Linux 网络编程基础（1）--网络相关的数据结构及转化函数

zoukankan html css js c++ java

Linux 网络编程基础（1）--网络相关的数据结构及转化函数

　　在Linux下进行网络编程，使用的语言一般为C。就个人感受而言，在Linux下进行网络程序的编写，重要的不是代码能力要多强，而是对Linux的网络编程思想的理解和对Linux网络数据结构的掌握。如果想要掌握一般的Linux网络代码编写，首要的任务是理解TCP和UDP协议，要在写代码的时候清晰的知道某段代码的作用是什么，对应的是网络协议哪一个步骤。这样才能够深刻的理解代码，慢慢的写出真正属于自己的代码，而不是人云亦云，亦步亦趋。

　　网络相关的数据结构

　　当然只是把IPv4和IPv6的常用数据结构总结一下，网络相关的数据结构还是很多的，Unix域的数据结构另外再说。

首先介绍struct sockaddr、struct sockaddr_in、struct in_addr。

　　typedef unsigned short sa_family_t;
　　struct sockaddr {
        sa_family_t     sa_family;    /* address family, AF_XXX */
        char            sa_data[14];    /* 14 bytes of protocol address */

　　};

　　结构体struct sockaddr定义在/usr/include/linux/socket.h中。

　　struct sockaddr_in {
sa_family_t       sin_family; /* Address family */
__be16            sin_port; /* Port number */
struct in_addr    sin_addr; /* Internet address */
unsigned char     __pad[__SOCK_SIZE__ - sizeof(short int) -
            sizeof(unsigned short int) - sizeof(struct in_addr)];
/* 字符数组sin_zero[8]的存在是为了保证结构体struct sockaddr_in的大小和结构体struct sockaddr的大小相等 */
　　};

结构体struct sockaddr_in在/usr/include/netinet/in.h中定义。

struct in_addr{

　　　　unsigned long s_addr;

　 };

　 in_addr其实就是32bit的IP地址。

　　struct sockaddr是通用的套接字地址，而struct sockaddr_in则是internet环境下套接字的地址形式，二者长度一样，都是16个字节。二者是并列结构，指向sockaddr_in结构的指针也可以指向sockaddr。一般情况下，需要把sockaddr_in结构强制转换成sockaddr结构再传入系统调用函数中。

　　主机字节序和网络字节序

　　在介绍上述三个结构体的成员变量之前，先介绍一下字节序。由于网络的特点是将网络上不同的设备和主机进行连接和通信，这就要求开发的网络程序要兼容不同的设备，数据对于设备要有唯一的含义，字节序就是上述问题的典型代表。字节序分为两类：大端字节序和小端字节序。

　　小端字节序(Little Endian)：将数据的最低字节放在内存的起始位置。特点是内存的低位放置数据的低位。

　　大端字节序(Big Endian)：将数据的高字节放在内存的起始位置。特点是内存的低位放置数据的高位。与思维习惯不一致，但是与数据的表达是一致的。比如一个四字节的数据0x12345678，起始的内存位置为0x1000；按照大端和小端的存放规范分别是：

　　　　内存地址　　　　0x1000　　0x1001　　0x1002　　0x1003

　　　　小端模式　　　　 0x78　　　 0x56　　　 0x34　　　 0x12

　　　　大端模式　　　　 0x12　　　 0x34　　　 0x56　　　 0x78

　　网络的字节序为大端字节序，所以在进行网络传输前，要将本地的数据转化为网络字节序，到达主机后，再转化为主机字节序。为了完成字节序的转化，Linux提供了一些转化的API，稍候再讨论相关的细节。那要是不知道一台机器的字节序，怎么通过代码来检查此主机的字节序呢？

　　结构体 struct sockaddr_in

　　重点分析一下sockaddr_in结构体，它是Intnet域网络编程的重要的数据结构之一。一一分析一下词数据结构的成员。

　　1、sin_family可以指定当前的网络程序遵循IPv4还是IPv6，经典的赋值方式是：

　　struct sockaddr_in skt_addr;

　　skt_addr.sin_family = AF_INET; /*使用IPv4版本*/

　　skt_addr.sin_family = AF_INET6; /*使用IPv6版本*/

　　2、sin_port是一个网络字节序的16整型。一定当前的网络程序的端口(此处的端口可以十分简化的理解为：不同网络程序的标记，不同的网络程序使用不同的端口，这样不同网络服务之间就可以进行区分了，当然这种理解是片面)。端口大致可以分为三类：

　 1.周知端口（Well Known Ports）

　　　周知端口是众所周知的端口号，范围从0到1023，其中80端口分配给www服务，21端口分配给FTP服务等。我们在IE的地址栏里输入一个网址的时候是不必　　指定端口号的，因为在默认情况下www服务的端口号是“80”。所以这个范围的端口就不能自己随便用了。

　　2.动态端口（Dynamic Ports）

　　动态端口的范围是从49152到65535。之所以称为动态端口，是因为它一般不固定分配某种服务，而是动态分配。动态分配是指当一个系统进程或应用程序进程需要网络通信时，它向主机申请一个端口，主机从可用的端口号中分配一个供它使用。当这个进程关闭时，同时也就释放了所占用的端口号。

　　3.注册端口

　　   端口1024到49151，分配给用户进程或应用程序。这些进程主要是用户选择安装的一些应用程序，而不是已经分配好了公认端口的常用程序。这些端口在没有被服务器资源占用的时候，可以用用户端动态选用为源端口。

所以一般情况下自己写程序，使用的都是注册端口。好了，假如我们已经知道我们在IPv4协议下进行通信，使用端口8888，那代码怎么写？

　　struct sockaddr_in skt_addr;

　　skt_addr.sin_family = AF_INET;

　　skt_addr.sin_port = 8888; /*这么写就错了，为啥？？！！*/

　　原因就是我们要保证所有的数据都是网络字节序的。这个时候字节序的转化函数就很有必要了。为了程序设计的方便，

　　Linux提供了平台无关的四个字节转换函数：

　　#include<arpa/inet.h>

　　uint32_t htonl(uint32_t hostlong); /*长整型主机字节序到网络字节序*/

　　uint16_t htons(uint16_t hostlong); /*短整型主机字节序到网络字节序*/

　　uint32_t ntohl(uint32_t hostlong); /*长整型网络字节序到主机字节序*/

　　uint16_t ntohs(uint16_t hostlong); /*短整型   网络字节序到主机字节序*/

　　所以上面的代码应该这么写：

　　struct sockaddr_in skt_addr;

　　skt_addr.sin_family = AF_INET;

　　skt_addr.sin_port = htons(8888); /*这么写就可以了*/

　　3、 struct in_addr sin_addr 这个成员其实我们很熟悉了，非计算机的人也听说过IP地址。这个就是32bit的IP地址。那编程时对这个成员赋与一个点分十　　进制的IP地址，就可以使我们的数据在网络上传输了？显然不可以的。

　　计算机的存储和人的认知之间是有差距的，“127.0.0.1”这样的IP地址当然是直观的，但是在网络中需要对此数据进行修饰。修饰的函数如下：

　　#include<sys/socket.h>

　　#include<netinet/in.h>

　　#include<arpa/inet.h>

　　int inet_aton(const char *cp, struct in_addr *inp); /*将点分十进制的IP地址转化为in_addr*/

　　in_addr_t inet_addr(const char *cp); /*将点分十进制的IP地址转化为in_addr, 不过返回值不一样了*/

　　有了网络上的IP，怎么转化为可读的IP地址呢？

　　char * inet_ntoa(struct in_addr in); /*将in_addr转化为点分十进制的IP地址*/

　　其实现在使用的转化函数为inet_ntop()和inet_pton(); 因为这两个函数是可重入的，而且支持多种地址类型。

　　int inet_pton(int af, const char *src, void *dst);

　　af: 指定地址类型，AF_INET或者INET_INET6

　　src: 点分十进制的IP地址

　　dst: 转化后的网络IP地址，一般接收到后，使用强制类型转换得到in＿addr

　　char *inet_ntop(int af, const void *src, char *dst, socklen_t cnt);

　　af: 指定地址类型，AF_INET或者INET_INET6

　　src: 待转化的网络地址

　　dst: 接收点分十进制的IP地址

　　cnt：dst的大小，若此值设置过小，会导致ENOSPC错误。

　　到目前为止，我们可以完整的定义并且初始化一个sockaddr_in 结构体了。

　　struct sockaddr_in skt_addr;

　　skt_addr.sin_family = AF_INET;

　　skt_addr.sin_port = htons(8888); /*这么写就可以了*/

　　skt_addr.sin_addr = inet_pton("127.0.0.1");

　　基本的数据结构介绍到此。

　　下一篇：获取主机信息、协议处理函数

查看全文

相关阅读:
ViScript 1.0 Released
How to: 修改程序的拖拽行为
 API Hooking 的原理
 小T历险记
 我的酒窝.NET
MSN Space
Naive Container 发布1.0版本
 EFT acceptance and functional testing tool for Windows application
[译]JavaScript:如何判断值的类型
 [译]JavaScript:多行字符串

原文地址：https://www.cnblogs.com/tju-gsp/p/3652440.html