创建一个工作队列用来在工作者(consumer)间分发耗时任务。
工作队列的主要任务是:避免立刻执行资源密集型任务,然后必须等待其完成。相反地,我们进行任务调度:我们把任务封装为消息发送给队列。工作进行在后台运行并不断的从队列中取出任务然后执行。当你运行了多个工作进程时,任务队列中的任务将会被工作进程共享执行。
这样的概念在web应用中极其有用,当在很短的HTTP请求间需要执行复杂的任务。
1、 准备
我们使用Thread.sleep来模拟耗时的任务。我们在发送到队列的消息的末尾添加一定数量的点,每个点代表在工作线程中需要耗时1秒,例如hello…将会需要等待3秒。
发送端:
1 public class NewTask 2 { 3 //队列名称 4 private final static String QUEUE_NAME = "workqueue"; 5 6 public static void main(String[] args) throws IOException 7 { 8 //创建连接和频道 9 ConnectionFactory factory = new ConnectionFactory(); 10 factory.setHost("localhost"); 11 Connection connection = factory.newConnection(); 12 Channel channel = connection.createChannel(); 13 //声明队列 14 channel.queueDeclare(QUEUE_NAME, false, false, false, null); 15 //发送10条消息,依次在消息后面附加1-10个点 16 for (int i = 0; i < 10; i++) 17 { 18 String dots = ""; 19 for (int j = 0; j <= i; j++) 20 { 21 dots += "."; 22 } 23 String message = "helloworld" + dots+dots.length(); 24 channel.basicPublish("", QUEUE_NAME, null, message.getBytes()); 25 System.out.println(" [x] Sent '" + message + "'"); 26 } 27 //关闭频道和资源 28 channel.close(); 29 connection.close(); 30 31 } 32 33 34 }
接收端:
1 public class Work 2 { 3 //队列名称 4 private final static String QUEUE_NAME = "workqueue"; 5 6 public static void main(String[] argv) throws java.io.IOException, 7 java.lang.InterruptedException 8 { 9 //区分不同工作进程的输出 10 int hashCode = Work.class.hashCode(); 11 //创建连接和频道 12 ConnectionFactory factory = new ConnectionFactory(); 13 factory.setHost("localhost"); 14 Connection connection = factory.newConnection(); 15 Channel channel = connection.createChannel(); 16 //声明队列 17 channel.queueDeclare(QUEUE_NAME, false, false, false, null); 18 System.out.println(hashCode 19 + " [*] Waiting for messages. To exit press CTRL+C"); 20 21 QueueingConsumer consumer = new QueueingConsumer(channel); 22 // 指定消费队列 23 channel.basicConsume(QUEUE_NAME, true, consumer); 24 while (true) 25 { 26 QueueingConsumer.Delivery delivery = consumer.nextDelivery(); 27 String message = new String(delivery.getBody()); 28 29 System.out.println(hashCode + " [x] Received '" + message + "'"); 30 doWork(message); 31 System.out.println(hashCode + " [x] Done"); 32 33 } 34 35 } 36 37 /** 38 * 每个点耗时1s 39 * @param task 40 * @throws InterruptedException 41 */ 42 private static void doWork(String task) throws InterruptedException 43 { 44 for (char ch : task.toCharArray()) 45 { 46 if (ch == '.') 47 Thread.sleep(1000); 48 } 49 } 50 }
Round-robin 转发
使用任务队列的好处是能够很容易的并行工作。如果我们积压了很多工作,我们仅仅通过增加更多的工作者就可以解决问题,使系统的伸缩性更加容易。
下面我们先运行3个工作者(Work.java)实例,然后运行NewTask.java,3个工作者实例都会得到信息。
1 [x] Sent 'helloworld.1' 2 [x] Sent 'helloworld..2' 3 [x] Sent 'helloworld...3' 4 [x] Sent 'helloworld....4' 5 [x] Sent 'helloworld.....5' 6 [x] Sent 'helloworld......6' 7 [x] Sent 'helloworld.......7' 8 [x] Sent 'helloworld........8' 9 [x] Sent 'helloworld.........9' 10 [x] Sent 'helloworld..........10' 11 工作者1: 12 605645 [*] Waiting for messages. To exit press CTRL+C 13 605645 [x] Received 'helloworld.1' 14 605645 [x] Done 15 605645 [x] Received 'helloworld....4' 16 605645 [x] Done 17 605645 [x] Received 'helloworld.......7' 18 605645 [x] Done 19 605645 [x] Received 'helloworld..........10' 20 605645 [x] Done 21 工作者2: 22 18019860 [*] Waiting for messages. To exit press CTRL+C 23 18019860 [x] Received 'helloworld..2' 24 18019860 [x] Done 25 18019860 [x] Received 'helloworld.....5' 26 18019860 [x] Done 27 18019860 [x] Received 'helloworld........8' 28 18019860 [x] Done 29 工作者3: 30 18019860 [*] Waiting for messages. To exit press CTRL+C 31 18019860 [x] Received 'helloworld...3' 32 18019860 [x] Done 33 18019860 [x] Received 'helloworld......6' 34 18019860 [x] Done 35 18019860 [x] Received 'helloworld.........9' 36 18019860 [x] Done
可以看到,默认的,RabbitMQ会一个一个的发送信息给下一个消费者(consumer),而不考虑每个任务的时长等等,且是一次性分配,并非一个一个分配。平均的每个消费者将会获得相等数量的消息。这样分发消息的方式叫做round-robin。
2、 消息应答(message acknowledgments)
执行一个任务需要花费几秒钟。你可能会担心当一个工作者在执行任务时发生中断。我们上面的代码,一旦RabbItMQ交付了一个信息给消费者,会马上从内存中移除这个信息。在这种情况下,如果杀死正在执行任务的某个工作者,我们会丢失它正在处理的信息。我们也会丢失已经转发给这个工作者且它还未执行的消息。
上面的例子,我们首先开启两个任务,然后执行发送任务的代码(NewTask.java),然后立即关闭第二个任务,结果为:
1 工作者2: 2 31054905 [*] Waiting for messages. To exit press CTRL+C 3 31054905 [x] Received 'helloworld..2' 4 31054905 [x] Done 5 31054905 [x] Received 'helloworld....4' 6 工作者1: 7 18019860 [*] Waiting for messages. To exit press CTRL+C 8 18019860 [x] Received 'helloworld.1' 9 18019860 [x] Done 10 18019860 [x] Received 'helloworld...3' 11 18019860 [x] Done 12 18019860 [x] Received 'helloworld.....5' 13 18019860 [x] Done 14 18019860 [x] Received 'helloworld.......7' 15 18019860 [x] Done 16 18019860 [x] Received 'helloworld.........9' 17 18019860 [x] Done
可以看到,第二个工作者至少丢失了6,8,10号任务,且4号任务未完成。
但是,我们不希望丢失任何任务(信息)。当某个工作者(接收者)被杀死时,我们希望将任务传递给另一个工作者。
为了保证消息永远不会丢失,RabbitMQ支持消息应答(message acknowledgments)。消费者发送应答给RabbitMQ,告诉它信息已经被接收和处理,然后RabbitMQ可以自由的进行信息删除。
如果消费者被杀死而没有发送应答,RabbitMQ会认为该信息没有被完全的处理,然后将会重新转发给别的消费者。通过这种方式,你可以确认信息不会被丢失,即使消者偶尔被杀死。
这种机制并没有超时时间这么一说,RabbitMQ只有在消费者连接断开是重新转发此信息。如果消费者处理一个信息需要耗费特别特别长的时间是允许的。
消息应答默认是打开的。上面的代码中我们通过显示的设置autoAsk=true关闭了这种机制。下面我们修改代码(Work.java):
1 boolean ack = false ; //打开应答机制 2 channel.basicConsume(QUEUE_NAME, ack, consumer); 3 //另外需要在每次处理完成一个消息后,手动发送一次应答。 4 channel.basicAck(delivery.getEnvelope().getDeliveryTag(), false);
完整修改后的Work.java
1 public class Work 2 { 3 //队列名称 4 private final static String QUEUE_NAME = "workqueue"; 5 6 public static void main(String[] argv) throws java.io.IOException, 7 java.lang.InterruptedException 8 { 9 //区分不同工作进程的输出 10 int hashCode = Work.class.hashCode(); 11 //创建连接和频道 12 ConnectionFactory factory = new ConnectionFactory(); 13 factory.setHost("localhost"); 14 Connection connection = factory.newConnection(); 15 Channel channel = connection.createChannel(); 16 //声明队列 17 channel.queueDeclare(QUEUE_NAME, false, false, false, null); 18 System.out.println(hashCode 19 + " [*] Waiting for messages. To exit press CTRL+C"); 20 QueueingConsumer consumer = new QueueingConsumer(channel); 21 // 指定消费队列 22 boolean ack = false ; //打开应答机制 23 channel.basicConsume(QUEUE_NAME, ack, consumer); 24 while (true) 25 { 26 QueueingConsumer.Delivery delivery = consumer.nextDelivery(); 27 String message = new String(delivery.getBody()); 28 29 System.out.println(hashCode + " [x] Received '" + message + "'"); 30 doWork(message); 31 System.out.println(hashCode + " [x] Done"); 32 //发送应答 33 channel.basicAck(delivery.getEnvelope().getDeliveryTag(), false); 34 35 } 36 37 } 38 }
测试:
我们把消息数量改为5,然后先打开两个消费者(Work.java),然后发送任务(NewTask.java),立即关闭一个消费者,观察输出:
1 [x] Sent 'helloworld.1' 2 [x] Sent 'helloworld..2' 3 [x] Sent 'helloworld...3' 4 [x] Sent 'helloworld....4' 5 [x] Sent 'helloworld.....5' 6 工作者2 7 18019860 [*] Waiting for messages. To exit press CTRL+C 8 18019860 [x] Received 'helloworld..2' 9 18019860 [x] Done 10 18019860 [x] Received 'helloworld....4' 11 工作者1 12 31054905 [*] Waiting for messages. To exit press CTRL+C 13 31054905 [x] Received 'helloworld.1' 14 31054905 [x] Done 15 31054905 [x] Received 'helloworld...3' 16 31054905 [x] Done 17 31054905 [x] Received 'helloworld.....5' 18 31054905 [x] Done 19 31054905 [x] Received 'helloworld....4' 20 31054905 [x] Done
可以看到工作者2没有完成的任务4,重新转发给工作者1进行完成了。
3、 消息持久化(Message durability)
我们已经学习了即使消费者被杀死,消息也不会被丢失。但是如果此时RabbitMQ服务被停止,我们的消息仍然会丢失。
当RabbitMQ退出或者异常退出,将会丢失所有的队列和信息,除非你告诉它不要丢失。我们需要做两件事来确保信息不会被丢失:我们需要给所有的队列和消息设置持久化的标志。
第一, 我们需要确认RabbitMQ永远不会丢失我们的队列。为了这样,我们需要声明它为持久化的。
1 boolean durable = true; 2 channel.queueDeclare("task_queue", durable, false, false, null);
注:RabbitMQ不允许使用不同的参数重新定义一个队列,所以已经存在的队列,我们无法修改其属性。
第二, 我们需要标识我们的信息为持久化的。通过设置MessageProperties(implements BasicProperties)值为PERSISTENT_TEXT_PLAIN。
1 channel.basicPublish("", "task_queue",MessageProperties.PERSISTENT_TEXT_PLAIN,message.getBytes());
现在你可以执行一个发送消息的程序,然后关闭服务,再重新启动服务,运行消费者程序做下实验。
4、公平转发(Fair dispatch)
或许会发现,目前的消息转发机制(Round-robin)并非是我们想要的。例如,这样一种情况,对于两个消费者,有一系列的任务,奇数任务特别耗时,而偶数任务却很轻松,这样造成一个消费者一直繁忙,另一个消费者却很快执行完任务后等待。
造成这样的原因是因为RabbitMQ仅仅是当消息到达队列进行转发消息。并不在乎有多少任务消费者并未传递一个应答给RabbitMQ。仅仅盲目转发所有的奇数给一个消费者,偶数给另一个消费者。
为了解决这样的问题,我们可以使用basicQos方法,传递参数为prefetchCount = 1。这样告诉RabbitMQ不要在同一时间给一个消费者超过一条消息。换句话说,只有在消费者空闲的时候会发送下一条信息。
1 int prefetchCount = 1; 2 channel.basicQos(prefetchCount);
注:如果所有的工作者都处于繁忙状态,你的队列有可能被填充满。你可能会观察队列的使用情况,然后增加工作者,或者使用别的什么策略。
测试:改变发送消息的代码,将消息末尾点数改为6-2个,然后首先开启两个工作者,接着发送消息:
1 [x] Sent 'helloworld......6' 2 [x] Sent 'helloworld.....5' 3 [x] Sent 'helloworld....4' 4 [x] Sent 'helloworld...3' 5 [x] Sent 'helloworld..2' 6 工作者1: 7 18019860 [*] Waiting for messages. To exit press CTRL+C 8 18019860 [x] Received 'helloworld......6' 9 18019860 [x] Done 10 18019860 [x] Received 'helloworld...3' 11 18019860 [x] Done 12 工作者2: 13 31054905 [*] Waiting for messages. To exit press CTRL+C 14 31054905 [x] Received 'helloworld.....5' 15 31054905 [x] Done 16 31054905 [x] Received 'helloworld....4' 17 31054905 [x] Done 18 31054905 [x] Received 'helloworld..2' 19 31054905 [x] Done
可以看出此时并没有按照之前的Round-robin机制进行转发消息,而是当消费者不忙时进行转发。且这种模式下支持动态增加消费者,因为消息并没有发送出去,动态增加了消费者马上投入工作。而默认的转发机制会造成,即使动态增加了消费者,此时的消息已经分配完毕,无法立即加入工作,即使有很多未完成的任务。
完整代码:
1 public class NewTask 2 { 3 // 队列名称 4 private final static String QUEUE_NAME = "workqueue_persistence"; 5 6 public static void main(String[] args) throws IOException 7 { 8 // 创建连接和频道 9 ConnectionFactory factory = new ConnectionFactory(); 10 factory.setHost("localhost"); 11 Connection connection = factory.newConnection(); 12 Channel channel = connection.createChannel(); 13 // 声明队列 14 boolean durable = true;// 1、设置队列持久化 15 channel.queueDeclare(QUEUE_NAME, durable, false, false, null); 16 // 发送10条消息,依次在消息后面附加1-10个点 17 for (int i = 5; i > 0; i--) 18 { 19 String dots = ""; 20 for (int j = 0; j <= i; j++) 21 { 22 dots += "."; 23 } 24 String message = "helloworld" + dots + dots.length(); 25 // MessageProperties 2、设置消息持久化 26 channel.basicPublish("", QUEUE_NAME, 27 MessageProperties.PERSISTENT_TEXT_PLAIN, message.getBytes()); 28 System.out.println(" [x] Sent '" + message + "'"); 29 } 30 // 关闭频道和资源 31 channel.close(); 32 connection.close(); 33 34 } 35 36 }
1 public class Work 2 { 3 // 队列名称 4 private final static String QUEUE_NAME = "workqueue_persistence"; 5 6 public static void main(String[] argv) throws java.io.IOException, 7 java.lang.InterruptedException 8 { 9 // 区分不同工作进程的输出 10 int hashCode = Work.class.hashCode(); 11 // 创建连接和频道 12 ConnectionFactory factory = new ConnectionFactory(); 13 factory.setHost("localhost"); 14 Connection connection = factory.newConnection(); 15 Channel channel = connection.createChannel(); 16 // 声明队列 17 boolean durable = true; 18 channel.queueDeclare(QUEUE_NAME, durable, false, false, null); 19 System.out.println(hashCode 20 + " [*] Waiting for messages. To exit press CTRL+C"); 21 //设置最大服务转发消息数量 22 int prefetchCount = 1; 23 channel.basicQos(prefetchCount); 24 QueueingConsumer consumer = new QueueingConsumer(channel); 25 // 指定消费队列 26 boolean ack = false; // 打开应答机制 27 channel.basicConsume(QUEUE_NAME, ack, consumer); 28 while (true) 29 { 30 QueueingConsumer.Delivery delivery = consumer.nextDelivery(); 31 String message = new String(delivery.getBody()); 32 33 System.out.println(hashCode + " [x] Received '" + message + "'"); 34 doWork(message); 35 System.out.println(hashCode + " [x] Done"); 36 //channel.basicAck(delivery.getEnvelope().getDeliveryTag(), false); 37 channel.basicAck(delivery.getEnvelope().getDeliveryTag(), false); 38 39 } 40 41 } 42 43 /** 44 * 每个点耗时1s 45 * 46 * @param task 47 * @throws InterruptedException 48 */ 49 private static void doWork(String task) throws InterruptedException 50 { 51 for (char ch : task.toCharArray()) 52 { 53 if (ch == '.') 54 Thread.sleep(1000); 55 } 56 } 57 }
参考博客:http://blog.csdn.net/lmj623565791/article/details/37620057