uhttpd是一个简单的web服务器程序,以前没怎么接触过,所以这里主要是对web服务器设计的一些学习总结。Openwrt系统中,真正用到的(需要了解的),其实不多,主要就是cgi的处理,包括与cgi程序的信息交互等,最后一节详细描述一下。
1.HTTP协议概述
HTTP协议是目前互联网使用最广泛的应用层协议。其协议框架很简单,在一个TCP连接中,以一问一答的方式进行信息交互。具体讲,就是客户端(如常见的浏览器)connect服务端的知名端口(通常是80),建立一个TCP连接,然后发送一个request;服务器端对该request解析后,发回相应的response应答,并关闭TCP连接。这就是一次交互,之后客户端再有请求,则重复上面的过程。
交互报文格式如下图所示:
Request报文首行为request-line,其中type有GET、POST、HEAD三种方式,然后最重要的是url,它告诉服务器所请求的资源。Response报文首行为response-line,其中最重要的是code,它告知客户端响应情况(found、redirect、error等),然后跟一个简单的可读的短语。
两种报文后面具体的内容格式差不多,都是一些headers(其中冒号前的str指明header类型),然后以一个空行标识header结束,后面是数据。对于request,只有POST类型的请求需要提交数据,其它类型的是没有数据的。Response报文的数据就是url所指定的资源文件(html、doc、gif等)。
2.服务器架构
Uhttpd作为一个简单的web服务器,其代码量并不多,而且组织结构比较清楚。和其它网络服务器差不多,其main函数进行一些初始化(首先parse config-file,然后parse argv),然后进入一个循环,不断地监听,每当有一个客户请求到达时,则对它进行处理。
对于web服务器,所要做的处理主要就是分析url,判断出是file-request、cgi-request或lua-request,这主要是根据url的最前面的字符串(称为前缀prefix)得出的;然后就用相应的形式进行处理。如下图所示:
3.cig-response流程
前面已提到,openwrt系统中使用的uhttpd服务,主要是用cgi方式来回应客户请求的,下面就对这种方式详细阐述。
3.1url解析
由上图红色字所示,uh_cgi_request需要两个二外的参数pathinfo和interpreter,其中pin是一个struct,包含了路径中各种有用信息;ipr指明所用的cgi程序,因为一个服务器中可以有多个cgi程序。
如图所示,docroot是服务器的资源目录,是为了os准确定位资源位置,由uhttpd的config文件设定,如openwrt中为/www。后面的是client传来的url,开头的为cgi-prefix,也是有uhttpd的config文件设定的,它指明serv端采用cgi处理方式,如openwrt中的为/www/cgi-bin;紧接着的是cgi的程序名,它指明了使用哪个cgi程序;再后面就是实际的path信息了,在cgi方式中,它会被当成参数供cgi程序使用。
3.2cgi处理框架
要运行cgi程序,首先意味着需fork出一个子进程,并通过execl函数替换进程空间为cgi程序;其次,数据传递,子进程替换了进程空间后,怎么获得原信息,有怎么把回馈数据传输给父进程(即uhttpd),父进程又怎么接收这些数据。
首先创建了两个pipe,这实际上是利用AF_UNIX协议域,创建两个相连的socket_unix,那么它们映射的文件描述符(即这里的fd[0]、fd[1])就构成了一个pipe,且这种关系即使fork后也仍然存在,因为fork仅是增加文件的引用次数,而os维护的file结构和socket结构都没变,这就是父子进程间传递数据的方式。然后fork出一个子进程。
子进程中首先把两个管道的一端close,注意这仅是使得文件引用次数变为1。由于子进程待会要excel替换,替换后rfd、wfd就不存在了,因此先把它们dup2给知名的stdin、stdout,这样即使execl替换后,ipt->extu程序可以以此来和父进程传递数据。另外,execl替换后,cgi程序仍需要之前的一些参数信息,如PATH_INFO等,这种情况下,最简单的办法就是setenv,把需要的参数设为环境变量。
为什么要两个pipe,因为子进程向父进程传递回馈数据需要一个out-pipe,而若有post数据,子进程还需要一个in-pipe,从父进程读取post数据。
父进程中首先也是close,同上所述。若有post数据,先从httprequest-header中得到content-length,为后面传递给子进程做准备。然后进入一个循环(为什么要循环,什么时候退出,后面讲),通过select轮询io,超时、中断的情况就不看了,轮询的io一个是reader,即从子进程读取回馈数据,而若有post数据的话,还要另一个io,writer,向子进程写post数据。主要的处理就是上图中红色字所示,具体如下: