grpc介绍
grpc是谷歌开源的一套基于rpc实现的通讯框架(官网有更完整的定义)。在搞懂grpc之前,首先要弄懂rpc是什么。下面是自己理解的rpc定义,若有不对,望指出:
rpc官方称为 远程过程调用 。我这里理解为远程函数调用,即一个本机程序调用另一个机器的程序中的某个函数。因不是同一机器调用,故需要远程访问操作。
与远程过程调用相反的则是“近程过程调用”(哈哈,自己乱起的)。其实就是实现和调用都在同一个机器的程序中。比如,学过面向对象语言的(如java)可以解释为:一个类中实现了一个方法,然后另一个程序中new了一个这个类的事例(对象),并调用该方法。而远程过程调用则相当于一个机器中实现了一个类的方法,另一个机器new了这个类的对象,它若想要调用该方法,必须要与实现了类方法的机器进行通讯。此时我们可以称实现了类方法的机器为服务端,new了对象的机器为客户端。
grpc通信方式
grpc同http通讯一样,也是基于“请求响应”模式的一种通讯。客户端请求,服务器响应。关于grpc的更多介绍可以参考官网。下面说一下grpc的四种通信方式[见官网],根据不同业务场景,可以分为:
1. 客户端单次请求,服务端回应一次:
// Obtains the feature at a given position.
rpc GetFeature(Point) returns (Feature) {}
2. 客户端一次请求,服务端流式应答(其实相当于返回给客户端多条数据)
// Obtains the Features available within the given Rectangle. Results are
// streamed rather than returned at once (e.g. in a response message with a
// repeated field), as the rectangle may cover a large area and contain a
// huge number of features.
rpc ListFeatures(Rectangle) returns (stream Feature) {}
3. 客户端流式请求,服务端回应一次
// Accepts a stream of Points on a route being traversed, returning a
// RouteSummary when traversal is completed.
rpc RecordRoute(stream Point) returns (RouteSummary) {}
4. 客户端流式请求,服务端流式应答
// Accepts a stream of RouteNotes sent while a route is being traversed,
// while receiving other RouteNotes (e.g. from other users).
rpc RouteChat(stream RouteNote) returns (stream RouteNote) {}
知道了四种通信方式后,回到主要问题上,我们要利用这四种通信方式来实现客户端与服务端互相通信。要实现互相通信,我这里想到的有两种:
- 客户端与服务端各自既是客户端又是服务端
这种方式感觉是最容易实现的。即在客户端与服务端之间各实现一套“请求响应模型”,这样客户端主动通信服务端时是正常请求响应,服务端主动通信客户端时它此时就变为客户端来请求。这样在外部看来两个机器之间就能互相通信了。
该种实现方式建立了两个通道来通信。缺点是要实现两套通信代码。 - 客户端与服务端直接互相通信
我们已经知道grpc是基于请求响应的,客户端请求,服务端响应。那怎么让服务端主动请求客户端通信呢? 其实我们可以用grpc的 第2或第4种的服务端流式响应 。原理是可以让客户端先发一个空消息给服务端让服务端知道(相当于客户端在服务端注册),然后服务端流式回应。因流式回应不会一下子都回完,我们可以在中途把服务端要发给客户端的消息加入到流中,让流把消息捎回到客户端。
在外部来看客户端与服务端能互相通信了。不过这种缺点是把互相通信的业务都糅杂到一块了。
具体实现
上面说了两种互相通信的实现方法及grpc的四种通信方式。这里采用第二种实现方法及grpc的第二种通信方式来实现,编程语言采用Python实现。
grpc采用protobuf来定义和传输数据。故通信的数据是用proto文件来定义的。关于proto的语法可以参考文档
首先建立如下的目录:
│ contact_client.py
│ contact_server.py
|
├─contact
│ │ contact.proto
│ │
│ │ __init__.py
│
contact.proto:定义通信的数据部分
contact_client.py:客户端代码
contact_server.py:服务端代码
contact.proto内容如下:
syntax = "proto3";
// 定义一个服务
service Contact {
// 客户端通信给服务端,通信方式可以随意选择,这里我选择第4种通信方式
rpc sendStatus (stream ClientMsg) returns (stream Result);
// 客户端发送一个空消息给服务端,服务端就能给客户端通信了
rpc getTask (Empty) returns (stream ServerMsg);
// 客户端接受完服务端消息处理完后,再告诉服务端。这个tellResult也可以不要,看具体需求
rpc tellResult (stream Result) returns (Empty);
}
message ClientMsg {
string msg = 1;
}
message ServerMsg {
string task = 1;
}
message Empty {
}
message Result {
string ret = 1;
}
在contact文件夹下运行命令:
python -m grpc_tools.protoc -I. --python_out=. --grpc_python_out=. contact.proto
会在contact目录下自动生成contact_pb2.py和contact_pb2_grpc.py两个文件。下来就是实现具体的通信了,首先是客户端向服务端发消息:
contact_server.py中代码实现具体代码:
# 注意服务端的具体实现函数是在类里面
def sendStatus(self, request_iterator, context):
for note in request_iterator:
yield contact_pb2.Result(
result=f"服务端接收到消息:{note.msg}"
)
contact_client.py中的代码为:
# 先制造一些客户端能发送的数据
def make_some_data():
for i in range(15):
num = random.randint(1, 20)
yield contact_pb2.ClientMsg(msg=f"数据:{num}")
def send_status(stub):
try:
while True:
status_response = stub.sendStatus(make_some_data())
for ret in status_response:
print(ret.result)
time.sleep(60)
except Exception as e:
print(f'err in send_status:{e}')
return
上面的代码就实现了客户端主动通信服务端的功能。可以看到是服务端先实现具体的代码,然后客护端调用具体函数与服务端通信,最后再对服务端返回的数据进行处理。
而服务端主动通信客户端的方式可以理解为:客户端先给服务端发送一个消息,告诉服务端我在线,然后服务端就能发数据给客户端了,最后客户端再通知服务端我接收了你的哪些数据。具体代码为:
server端代码:
import logging
import random
import time
from concurrent import futures
import grpc
from contact import contact_pb2_grpc
from contact import contact_pb2
# 在类初试化的时候定义了一个列表self.tasks来充当任务队列
def getTask(self, request_iterator, context):
print("服务端已接收到客户端上线通知,开始发送任务给客户端
")
last_index = 0
while True:
print("服务端开始发送任务给客户端了。。。。。。
")
while len(self.tasks) > last_index:
n = self.tasks[last_index]
last_index += 1
yield n
print(f'服务端发送给了客户端任务:{n.task}##########
')
# 顺便制造些服务端的任务数据用来填充到任务队列里面
for i in range(10):
num = random.randint(100, 200)
self.tasks.append(contact_pb2.ServerMsg(
task=f"任务:{num}"
))
time.sleep(40)
def tellResult(self, request_iterator, context):
for response in request_iterator:
print(f"我已经知道客户端接收到我发过去的任务:{response.ret}")
return contact_pb2.Empty()
client端代码
import logging
import random
import threading
import time
import grpc
from contact import contact_pb2
from contact import contact_pb2_grpc
# 接收服务端发送过来的任务
def get_task(stub):
try:
for task in stub.getTask(contact_pb2.Empty()):
print(f"客户端已接收到服务端任务:{task.task}
")
# 顺便再告诉服务端我已经接收到你发的任务,你不用担心我没接收到它
yield contact_pb2.Result(
ret=f"客户端接收到任务:{task.task}"
)
except Exception as e:
print(f'err:{e}')
return
# 客户端再通知服务端我接收到你的消息了
def tell_result(stub):
result = get_task(stub)
stub.tellResult(result)
def run():
with grpc.insecure_channel('localhost:50051') as channel:
stub = contact_pb2_grpc.ContactStub(channel)
while True:
try:
threading.Thread(target=send_status, args=(stub,), daemon=True).start()
tell_result(stub)
except grpc.RpcError as e:
print(f"server connected out, please retry:{e.code()},{e.details()}")
except Exception as e:
print(f'unknown err:{e}')
finally:
time.sleep(2)
if __name__ == '__main__':
run()
总结
从上面看出,服务端主动通信给客户端,还是逃不过grpc的请求响应方式。上面代码只是实现了一种互相通信的方法,但是没有既充当客户端又充当服务端那种方法简单。