1.RPC:简单点说,就是多线程之间的通信,我们今天用了scala以及akka
来简单的实现了
rpc框架的一些简单的内容,一脸包括了,心跳,间隔时间,
注册以及一些问题,
模式匹配的一些东西,虽然比较简单,但是属于麻雀虽小,五脏俱全
这个里面一共有有四个文件:
Master.scala
RemoteMessage.scala
Worker.scala
WorkerInfo
Master.scala
package cn.wj.rpc import akka.actor.{Actor, ActorSystem} import akka.actor.Actor.Receive import com.typesafe.config.ConfigFactory import akka.actor.Props import scala.concurrent.duration._ import scala.collection.mutable /** * Created by WJ on 2016/12/23. */ class Master(val host:String,val port:Int ) extends Actor { // workerId -> WorkerInfo val idToWorker = new mutable.HashMap[String,WorkerInfo]() val workers = new mutable.HashSet[WorkerInfo]() //时间间隔时间,超时检测的间隔 val CHECK_INTERVAL = 15000 //用于接收消息 override def receive: Receive = { case RegisterWorker(id,memory,cores) => { // println("a client connected") // sender ! "reply" //往发送给他消息的人回复一个消息 //判断一下是不是已经注册过了 if(!(idToWorker.contains(id))){ //把Worker的信息封装以前,保存到内存当中 val workerInfo = new WorkerInfo(id,memory,cores) idToWorker(id) = workerInfo //这个应该是scala的特定版本 workers += workerInfo sender ! RegisteredWorker(s"akka.tcp://MasterSystem@$host:$port/user/Master") } } case Heartbeat(id) =>{ if(idToWorker.contains(id)) { val workerInfo = idToWorker(id) //报活 //得到系统当前时间 val currentTime = System.currentTimeMillis() workerInfo.lastHeartbeatTime = currentTime } } case CheckTimeOutWorker => { val currentTime = System.currentTimeMillis() val toRemove = workers.filter(x => currentTime - x.lastHeartbeatTime > CHECK_INTERVAL) for(w <- toRemove){ workers -= w idToWorker -= w.id } println(workers.size) } } override def preStart(): Unit = { println("prestart invoked") //导入隐式转换的功能 import context.dispatcher context.system.scheduler.schedule(0 millis,CHECK_INTERVAL millis,self,CheckTimeOutWorker) } } object Master{ def main(args: Array[String]): Unit = { val host = args(0) val port = args(1).toInt // 准备配置 val configStr = s""" |akka.actor.provider = "akka.remote.RemoteActorRefProvider" |akka.remote.netty.tcp.hostname = "$host" |akka.remote.netty.tcp.port = "$port" """.stripMargin val config = ConfigFactory.parseString(configStr) //ActorSystem老大,辅助创建和监控下面的Actor,他是单例的 val actorSystem = ActorSystem("MasterSystem",config ) //创建Actor val master = actorSystem.actorOf(Props(new Master(host,port)),"Master") actorSystem.awaitTermination() } }
Worker.scala
package cn.wj.rpc import java.util.UUID import akka.actor.{Actor, ActorSelection, ActorSystem, Props} import com.typesafe.config.ConfigFactory import scala.concurrent.duration._ /** * Created by WJ on 2016/12/23. */ class Worker(val masterHost:String,val masterPort:Int,val memory:Int,val cores:Int) extends Actor { var master : ActorSelection = _ val workerId = UUID.randomUUID().toString val HEART_INTERVAL = 10000 //preStart执行方法的时机:构造器之后,receive之前 //与Master(Actor)建立连接 override def preStart(): Unit = { //master已经是别的Master的引用了 ,这是跟master建立连接 master = context.actorSelection(s"akka.tcp://MasterSystem@$masterHost:$masterPort/user/Master") //向Master发送注册消息 master ! RegisterWorker(workerId,memory,cores) } override def receive: Receive = { case RegisteredWorker(masterUrl) => { println(masterUrl) //启动定时器发送心跳 import context.dispatcher context.system.scheduler.schedule(0 millis,HEART_INTERVAL millis,self,SendHeartbeat) } case SendHeartbeat =>{ println("send heartbeat to master") master ! Heartbeat(workerId) } } } object Worker{ def main(args: Array[String]): Unit = { val host = args(0) val port = args(1).toInt val masterHost = args(2) val masterPort = args(3).toInt val memory = args(4).toInt val cores = args(5).toInt // 准备配置 val configStr = s""" |akka.actor.provider = "akka.remote.RemoteActorRefProvider" |akka.remote.netty.tcp.hostname = "$host" |akka.remote.netty.tcp.port = "$port" """.stripMargin val config = ConfigFactory.parseString(configStr) //ActorSystem老大,辅助创建和监控下面的Actor,他是单例的 val actorSystem = ActorSystem("WorkerSystem",config ) //创建Actor,此时调用该(Actor)的prestart以及receive方法 actorSystem.actorOf(Props(new Worker(masterHost,masterPort,memory,cores)),"Worker") actorSystem.awaitTermination() } }
RemoteMessage.scala
package cn.wj.rpc /** * Created by WJ on 2016/12/25. */ trait RemoteMessage extends Serializable //Worker->Master(这个表明当master接受这个worker时的信息,是receive) case class RegisterWorker (id:String, memory:Int, cores:Int) extends RemoteMessage //Master -> Worker(这个是master收到workerd的注册信息,表明已经注册过这条信息,是sender ! xxx时候出现的) case class RegisteredWorker(masterUrl:String) extends RemoteMessage //这是进程之间自己给自己发送消息,所以采用case object,并且不需要实现Serializable //Worker -> Worker(self) case object SendHeartbeat //这个是work向master发送定时器,其中的id是work的id,因为要向master说明,是哪一个work给他发送的心跳 //Worker -> Master case class Heartbeat(id:String) extends RemoteMessage //Master -> self case object CheckTimeOutWorker
WorkerInfo.scala
package cn.wj.rpc /** * Created by WJ on 2016/12/25. */ class WorkerInfo(val id:String ,val memory :Int,val cores:Int) { //TODO 上一次心跳 var lastHeartbeatTime:Long = _ }
这个上面的四个就是简单的实现了RPC框架,其实就是一个Master监控多个Worker,
当一个Worker创建了,他就是需要在Master注册信息,其实这个Master个人感觉就像
是个Zookeeper,掌管Worker的信息,为其Worker分配一些资源,当Master接到Worker
的注册信息的时候,他就在自己的注册表添加上这个Worker,然后向Worker发送一个注册
成功的信息,此时这个Worker的收到这个注册信息,然后他就给Master发送心跳,这个的
作用是在告诉Master,我这个Worker是存活的(报活),当一个Worke发送心跳的时间间隔
过长,长过我们规定的时间,那么此时我们就需要主动杀死这个Worker,感觉hadoop的一些
分布式和这个原理差不多。
下面奉上原理图一张:
其中的receive是用于接受信息,因为继承Actor,
prestart这个方法是执行实在类实例之后,receive的方法之后
2.RPC的大概流程
首先定义了一个worker,一个master,master首先启动了,
然后它在prestart()的方法里面
检测超时的worker,那么在这个里面启动了一个定时器,
那么我们自己是不是自己可以手写一个定时器,
比如我们可以用线程来搞定时器,但是我们的akka
里面提供了一个超级简单的定时器,
context.system.schedular.schedule
(0 millis,CHECK_INTERVAL millis,self,CheckTimeOutWorker)
其中第一个参数:延迟多少秒
第二个参数:时间间隔
第三个参数:把这个消息发给谁
第四个参数:发送什么消息
虽然它起了消息,但是他不能一下子就把消息发送出去
,它只能把消息先发送给自己的receive接收到这个消息,
然后在发送给我们master,这个里面有一个检测,
检测worker有多长时间没有向我发送心跳了,
如果这个时间大过了我规定的范围,
这样,Master启动完成检测心跳,worker启动完成后
,首先向master建立连接,然后发送注册消息
,master接受到这个注册消息,
把worker的信息保存到内存当中,然后向worker反馈一个消息,
说你注册成功了,然后worker启动一个定时器,
定时的向master发送心跳,就是这样的流程