zoukankan      html  css  js  c++  java
  • 用Python实现简单的服务器

    socket接口是实际上是操作系统提供的系统调用。socket的使用并不局限于Python语言,你可以用C或者JAVA来写出同样的socket服务器,而所有语言使用socket的方式都类似(Apache就是使用C实现的服务器)
    Web框架就是提前写好了服务器。不能跨语言的使用框架。框架的好处在于帮你处理了一些细节,从而实现快速开发,但同时受到Python本身性能的限制。我们已经看到,许多成功的网站都是利用动态语言(比如Python, Ruby或者PHP,比如twitter和facebook)快速开发,在网站成功之后,将代码转换成诸如C和JAVA这样一些效率比较高的语言,从而让服务器能更有效率的面对每天亿万次的请求。

    TCP/IP和socket

    socket是进程间通信的一种方法 ,它是基于网络传输协议的上层接口。socket有许多种类型,比如基于TCP协议或者UDP协议(两种网络传输协议)。其中又以TCP socket最为常用。TCP socket与双向管道(duplex PIPE)有些类似,一个进程向socket的一端写入或读取文本流,而另一个进程可以从socket的另一端读取或写入,比较特别是,这两个建立socket通信的进程可以分别属于两台不同的计算机,只需要通过网络链路和通信协议连同即可
    TCP协议,就是规定了一些通信的守则,以便在网络环境下能够有效实现上述进程间通信过程。双向管道(duplex PIPE)存活于同一台电脑中,所以不必区分两个进程的所在计算机的地址,而socket必须包含有地址信息,以便实现网络通信。
    一个socket包含四个地址信息: 两台计算机的IP地址和两个进程所使用的端口(port)。IP地址用于定位计算机,而port用于定位进程 (一台计算机上可以有多个进程分别使用不同的端口)。

    TCP socket

    我们可以让某台计算机作为服务器。服务器开放自己的端口,被动等待其他计算机连接我们这个port。当其他计算机作为客户,主动使用socket连接到服务器的时候,服务器就开始为客户提供服务。其实也就是二者建立了双向联通。

    在Python中,我们使用标准库中的socket包来进行底层的socket编程。
    首先是服务器端,我们使用bind()方法来赋予socket以固定的地址和端口,并使用listen()方法来被动的监听该端口。当有客户尝试用connect()方法连接的时候,服务器使用accept()接受连接,从而建立一个连接的socket:

    server.py

    import socket
    
    # Address
    HOST = '127.0.0.1'
    PORT = 8000
    
    # Configure socket
    s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
    s.bind((HOST, PORT))
    #socket.socket()创建一个socket对象,并说明socket使用的是IPv4(AF_INET,IP version 4)
    #和TCP协议(SOCK_STREAM)。
    
    # passively wait, 3: maximum number of connections in the queue
    s.listen(3)
    # accept and establish connection
    conn, addr = s.accept()
    # receive message
    request = conn.recv(1024)
    
    print ('request is: ',request)
    print ('Connected by', addr)
    
    # send message
    reply = 'Yes'
    """ 
    好像3.* socket.send 传递的数据必须是bytes。不能是str。发送和接收数据时做下编码转换就可以了。修改如下:s.sendall(request.encode())
    """
    conn.sendall(reply.encode())
    
    # close connection
    conn.close()

    client.py

    import socket
    
    # Address
    HOST = '127.0.0.1'
    PORT = 8000
    
    request = 'can you hear me?'
    
    # configure socket
    s       = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
    s.connect((HOST, PORT))
    
    """ 
    好像3.* socket.send 传递的数据必须是bytes。不能是str。发送和接收数据时做下编码转换就可以了。修改如下:s.sendall(request.encode())
    """
    
    # send message
    s.sendall(request.encode())
    # receive message
    reply   = s.recv(1024)
    print ('reply is: ',reply)
    # close connection
    s.close()

    我们对socket的两端都可以调用recv()方法来接收信息调用sendall()方法来发送信息。这样,我们就可以在分处于两台计算机的两个进程间进行通信了。当通信结束的时候,我们使用close()方法来关闭socket连接

    基于TCP socket的HTTP服务器

    使用TCP socket来为两台远程计算机建立连接,就可以通信了。
    然而socket传输自由度太高,从而带来很多安全和兼容的问题。我们往往利用一些应用层的协议(比如HTTP协议)来规定socket使用规则,以及所传输信息的格式。

    HTTP协议利用请求-回应(request-response)的方式来使用TCP socket。

    客户端向服务器发一段文本作为request,服务器端在接收到request之后,向客户端发送一段文本作为response。

    在完成了这样一次request-response交易之后,TCP socket被废弃。下次的request将建立新的socket。
    request和response本质上说是两个文本,只是HTTP协议对这两个文本都有一定的格式要求。

    Httpserver.py

    import socket
    
    # Address
    HOST = ''
    PORT = 8000
    
    # Prepare HTTP response
    text_content = '''HTTP/1.x 200 OK  
    Content-Type: text/html
    
    <head>
    <title>WOW</title>
    </head>
    <html>
    <p>Wow, Python Server</p>
    <IMG src="test.jpg"/>
    </html>
    '''
    
    # Read picture, put into HTTP format
    f = open('test.jpg','rb')
    pic_content = '''
    HTTP/1.x 200 OK  
    Content-Type: image/jpg
    
    '''
    
    pic_content = pic_content.bytes()+ f.read()
    f.close()
    
    # Configure socket
    s    = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
    s.bind((HOST, PORT))
    
    # infinite loop, server forever
    while True:
        # 3: maximum number of requests waiting
        s.listen(3)
        conn, addr = s.accept()
        request    = conn.recv(1024)
        method    = request.split(' ')[0]
        src            = request.split(' ')[1]
    
        # deal with GET method
        if method == 'GET':
            # ULR    
            if src == '/test.jpg':
                content = pic_content
            else: content = text_content
    
            print ('Connected by', addr)
            print ('Request is:', request)
            conn.sendall(content.bytes())
        # close connection
        conn.close()

    解读

    服务器会根据request向客户传输的两条信息text_content和pic_content中的一条,作为response文本。

    整个response分为起始行(start line), 头信息(head)和主体(body)三部分。

    起始行就是第一行:HTTP/1.x 200 OK 它实际上又由空格分为三个片段,HTTP/1.x表示所使用的HTTP版本,200表示状态(status code),200是HTTP协议规定的,表示服务器正常接收并处理请求,OK是供人来阅读的status code。

    头信息跟随起始行,它和主体之间有一个空行。这里的text_content或者pic_content都只有一行的头信息,text_content用来表示主体信息的类型为html文本:Content-Type: text/html

    主体信息为html或者jpg文件的内容。(注意,对于jpg文件,我们使用’rb’模式打开,是为了与windows兼容。因为在windows下,jpg被认为是二进制(binary)文件,在UNIX系统下,则不需要区分文本文件和二进制文件。)

    HttpClient.py

    客户端程序,你可以自己写。当然一般用浏览器作为客户端。
    request由客户端程序发给服务器。尽管request也可以像response那样分为三部分,但是request的格式与response的格式并不相同。request由客户发送给服务器,比如下面是一个request:

    GET /test.jpg HTTP/1.x
    Accept: text/*

    起始行可以分为三部分,第一部分为请求方法(request method),第二部分是URL,第三部分为HTTP版本。request method可以有GET, PUT, POST, DELETE, HEAD。最常用的为GET和POST。GET是请求服务器发送资源给客户,POST是请求服务器接收客户送来的数据。当我们打开一个网页时,我们通常是使用GET方法;当我们填写表格并提交时,我们通常使用POST方法。第二部分为URL,它通常指向一个资源(服务器上的资源或者其它地方的资源)。像现在这样,就是指向当前服务器的当前目录的test.jpg。

    按照HTTP协议的规定,服务器需要根据请求执行一定的操作。正如我们在服务器程序中看到的,我们的Python程序先检查了request的方法,随后根据URL的不同,来生成不同的response(text_content或者pic_content)。随后,这个response被发送回给客户端。

    Test

    终端运行上面的Httpserver程序,作为服务器端,再打开一个浏览器作为客户端。(如果有时间,你也完全可以用Python写一个客户端。原理与上面的TCP socket的客户端程序相类似。)
    在浏览器的地址栏输入:127.0.0.1:8000

    使用浏览器的调试功能 F12

    GET / HTTP/1.1
    Host: 127.0.0.1:8000
    User-Agent: Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:14.0) Gecko/20100101 Firefox/14.0.1
    Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
    Accept-Language: en-us,en;q=0.5
    Accept-Encoding: gzip, deflate
    Connection: keep-alive

    浏览器接收到text_content之后,发现正文的html文本中有,知道需要获得text.jpg文件来补充为图片,立即发出了第二个请求:

    GET /test.jpg HTTP/1.1
    Host: 127.0.0.1:8000
    User-Agent: Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:14.0) Gecko/20100101 Firefox/14.0.1
    Accept: image/png,image/*;q=0.8,*/*;q=0.5
    Accept-Language: en-us,en;q=0.5
    Accept-Encoding: gzip, deflate
    Connection: keep-alive
    Referer: http://127.0.0.1:8000/

    小结

    1) 在我们上面的服务器程序中,我们用while循环来让服务器一直工作下去。实际上使用多线程的知识,将while循环中的内容改为多进程或者多线程工作。

    2) 服务器程序还不完善,还可以让Python程序调用Python的其他功能,以实现更复杂的功能。比如说制作一个时间服务器,让服务器向客户返回日期和时间。你还可以使用Python自带的数据库,来实现一个完整的LAMP服务器。

    3) socket包是比较底层的包。Python标准库中还有高层的包,比如SocketServer,SimpleHTTPServer,CGIHTTPServer,cgi。这些都包都是在帮助我们更容易的使用socket。这些包就很容易明白了。利用这些高层的包,你可以写一个相当成熟的服务器。

    4) 在经历了所有的麻烦之后,发现框架是那么的方便,所以决定去使用框架。当然也可以参与到框架开发的热情。

  • 相关阅读:
    BZOJ 3236 AHOI 2013 作业 莫队算法
    使用再哈希算法查找元素
    冰雪奇缘--用爱酿就一部经典
    Scrapy系列教程(2)------Item(结构化数据存储结构)
    html学习笔记二
    知方可补不足~sqlserver中触发器的使用
    我心中的核心组件(可插拔的AOP)~调度组件quartz.net
    EF架构~为BulkInsert引入SET IDENTITY_INSERT ON功能
    知方可补不足~sqlserver中使用sp_who查看sql的进程
    知方可补不足~为千万级数据表加索引
  • 原文地址:https://www.cnblogs.com/itrena/p/7434085.html
Copyright © 2011-2022 走看看