引言
关于题目,对数据平面进行编程,在之前读过the road to SDN,软件定义网络的思想在于数控分离,其对网络行为的编程暂时只局限于网络控制平面。其转发平面在很大程度上受制于功能固定的包处理硬件。而P4语言的出现就是为了完全摆脱网络数据平面的束缚。P4被称作为完全可编程南向编程接口,其提出的目的就是为了解决Openflow编程能力不足及其设计本身所存在的可拓展性差的难题。
- P4的特性
- 目标无关性:其不受限于具体目标设备的方式控制转发行为。
- 协议无关性:可以利用编译器在不受限与具体协议的交换机或网卡上生成具体的配置。
关于P4这个名字的由来其实来自于“Programming Protocol-Independent Packet Processors”,翻译过来就是“与协议无关的数据包处理编程语言”
可编程数据平面可以达到的目标
针对于不同的使用者,其带来的优势也有所不同。
人员 | 优势 |
---|---|
网络系统供应商 | 更快速的迭代,快速便捷的修复数据平面的漏洞,可以与软件行业有所交流收益 |
网络拥有者 | 自定义网络功能,对于网络功能的设计更简便更具有针对性和可操作性 |
网络芯片供应商 | 将开发设计重点转移芯片的基本素质,数据包处理架构以及基本模块 |
科研人员 | 更方便的验证实现新的想法与功能 |
文章中总结了如下优点:
- 新功能:高速频繁的推出新的网络功能
- 降低复杂性:在网络设备中可以只保留所需要的协议功能,去除那些无用又复杂的协议。
- 有效利用资源:去掉不必要的功能(协议)之后就可以释放物理资源。提高资源利用率。
- 增强可视化:出于对硬件资源的合理利用和为了满足所有的转发需求,原本的芯片设计倾向于牺牲监测、分析、诊断功能。而可编程之后,对于功能定制的自由度就更高。
- 模块化:可以重用别人的P4代码库。
- 可移植性:单P4代码可以配置到多台设备中。
最后两点可以看出和如今的软件开发有着很相似的特点,这也说明了,在未来的开发中可以更多的借鉴和参考如今已经很成熟的软件开发模式。
总结
P4编程语言具有对交换机的协议解析流程和数据处理流程进行编程的能力,通过P4,交换设备无需关注协议语法语义等内容,就可以完成数据处理,进行网络编程无需关心底层设备的具体信息。就像python or C写上层应用时不需要关心CPU的信息一样。
协议无关的交换机架构
出于对先前用于固定功能的数据包处理硬件的不满足,提出了一种通用架构是协议无关的交换机架构——Protocol-Independent Switch Architecture 即PISA。
PISA架构
- 具有完全可编程数据包解析器,通用“匹配-动作”单元
- 没有配置的PISA芯片不能实现任何功能,这就是所谓的协议无关。
- 解析器和“匹配-动作”单元必须被编程后才能进行工作
- 解析包
- 解析之后的匹配原则
- 匹配之后进行的动作
- 高效率数据包处理
- 多个数据包处理以流水线方式工作
- 每个阶段有大量的“匹配-动作”单元进行并行操作。
- 逆解析:可编程,经过修改过的数据包头在输出之前需要重新组合。
- 回流路径:数据包可以重新反馈到解析器流水线进行重新处理。
- 数据包生成器:CPU可以将周期生成数据包的工作由此模块完成。
- 提供了连接数据和控制平面的高带宽通道。使得二者交互更为快速。
P4语言简介
每一个P4程序包含如下五个关键组件:
组件 | 功能 |
---|---|
Header(包头) | 定义描述一系列字段的顺序和结构,包括字段的宽度和字段值的限制 |
Parser(解析器) | 定义如何识别出包头 |
Table(表) | “匹配-动作”表是执行数据包处理的机制,P4程序定义了在表内可以匹配的字段和可以执行的操作 |
Action(动作) | 预先定义的与协议无关的简单基本操作,可以在表中使用 |
Control Program(控制程序) | 决定以什么顺序用“匹配-动作”表处理数据包 |
- Herder:由于数据包的处理都需要包头的字段内容决定其操作,所以P4中也需要相对应的去定义包头。
- Parser:定义包头之后,必须要定义包头协议字段之间的关系以及数据包的解析流程,所有的解析均从start开始,并在stop或者错误之后结束。
- Table:P4中需要定义多种用途的表来存储匹配表项,其表的格式为Match-Action,即匹配域和对应的执行动作。具体的流表项需要在网络运行过程中通过控制器来编程下发,从而完成对应数据流的处理。
- Action:P4定义了一套协议无关的原始指令集,基于这个指令集可以实现复杂的协议操作。与OpenFlow的动作类似,不过P4的是抽象程度更高的协议无关动作。
- Control Program:控制程序决定了数据包处理的流程,即数据包在不同匹配表中的跳转关系。当表和动作被定义和实现之后,还需要控制程序来确定不同表之间的控制流。
关于P4的语言规范
- P4算是一种声明式编程语言
- 强类型:所有数据类型、有效的运算符和操作规则已明确定义,避免歧义。
- 表达式:支持通用运算符组成各种表达式。
- 顺序执行语义。