zoukankan      html  css  js  c++  java
  • java多线程采集+线程同步

    前些日子讲解了java数据抓取, 今天就讲解最核心的。 java多线程数据抓取。 

    java多线程采集+数据同步+线程同步【多线程数据采集之四】

    主要讲解多线程抓取,多线程同步,多线程启动,控制等操作。

    转载请用链接注明: 来源博客http://blog.csdn.net/yjflinchong

    文章栏目列表:http://blog.csdn.net/column/details/threadgrab.html


    先讲解第一步,线程类。   核心数据抓取线程。

    这个例子主要讲解的是  对设定的天数的数据抓取。 从当前日期往后推。

    每个线程负责一天的数据任务抓取。

    源代码如下:

    1、线程类

    package com.yjf.util;
    import java.util.Date;
    import java.util.List;


    public class GetWebThread extends Thread{
        
        /**
         * 线程
         */
        public void run(){
            try {
                while (true) {
                    int day = 0;
                    long time1 = new Date().getTime();
                    //用来同步抓取线程
                    synchronized("searchthead"){
                        Main.thisdaycount++;
                        if(Main.thisdaycount>Main.daycount){
                            break;
                        }
                        System.out.println("开始查询第"+(Main.thisdaycount)+"天");
                        Thread.sleep(133);
                        day = Main.thisdaycount-1;
                    }
                    //获取抓取的时间
                    String datetext = TimeUtil.date.format(TimeUtil.addDaysForDate(day));
                    String[] txt =FileUtil.getCityByTxtFile();
                    for(int t=0;t<txt.length;t++){

                        String[] way = txt[t].split("\\|");
                        String start = way[0];
                        String end = way[1];
                        //抓取到的数据列表
                        List<DataBean> datalist = Main.getDataList(datetext, start, end);
                        if(datalist!=null){
                            Main.isadsl = 0;
                            CheckAdsl.adsllasttime = new Date().getTime();
                            FileUtil.addDataToFileCsv(datalist);
                            Main.log.printLog("===="+datetext+"="+start+"="+end+"="+t+"=数据总数:"+datalist.size());
                        }else{
                                Thread.sleep(11);
                                AdslThead.isadsl = true;
                                Thread.sleep(11);
                                //判断是否正在拨号 并暂停线程
                                while (AdslThead.isadsl) {
                                    Thread.sleep(5000);
                                }
                            t--;
                        }
                    }
                    long time2 = new Date().getTime();
                    Main.log.printLog(datetext+"==查询完毕=========耗时"+(time2-time1));
                }
            } catch (Exception e) {
                Main.log.printLog(e.getMessage());
                e.printStackTrace();
            }
        }
        
    }

    第二步, 准备线程启动。 

    控制线程数量。

    查询数据总天数。

    设置拨号状态等。

    2、线程启动类。 包括启动,控制,停止

    package com.yjf.util;

    import java.io.BufferedInputStream;
    import java.io.FileInputStream;
    import java.io.InputStream;
    import java.util.ArrayList;
    import java.util.Date;
    import java.util.List;
    import java.util.Properties;
    import java.util.Timer;


    public class Main {
        private static boolean isRunGrabThread = true;     //抓取线程是否执行完毕
        public static int threadCount = 3;   //线程数量
        public static int daycount = 30;         //查询总天数
        public static int thisdaycount = 0;
        public static int isadsl = 0;
        public static int adslcount = 1;
        
        
            public static void main(String[] args) {
                try {
                    
                    startThead();//启动抓取数据主线程
                } catch (Exception e) {
                    e.printStackTrace();
                }
            }
            
            
            public static void startThead(){
                Thread[] grabThreads= new Thread[threadCount];    
                try{          
                    //开启-数据抓取子线程
                      for(int i=0;i<grabThreads.length;i++){
                          Thread searchThread=new GetWebThread();
                          grabThreads[i] = searchThread;
                          grabThreads[i].setDaemon(true);
                          grabThreads[i].start();
                      }
                    
                      isRunGrabThread = true;
                      
                      //监控子线程,全部完成程序退出
                    WhileLoop:                                
                        
                    while(true){
                        
                        //拨号策略控制
                        //reconnectControl();    
                        
                        //判断子线程是否运行完成
                        for(int i=0;i<threadCount;i++){
                            if(grabThreads[i].isAlive()){
                                Thread.sleep(3*1000);
                                continue WhileLoop;
                            }
                        }

                        //所有抓取线程执行完毕
                        isRunGrabThread = false;
                        
                        //子线程执行完毕则退出
                        break;
                    }
                }
                catch (Exception e) {
                    System.out.println("main主线程--系统异常!");
                }
            }
            
            

    }

  • 相关阅读:
    Other.ini配置文件解读以及大众评委打分的最后得分两种模式选择及解析选项解释
    大作业练习:用Asp.net Mvc4做一个:学生考试成绩管理系统-简易版
    网络营销实施步骤及疑难问题汇编
    Web前端知识汇编收集B
    Web前端知识汇编收集A
    FlexItem 多行测试
    Last Work-随机出题加法游戏
    Android DisplayMetrics类获取屏幕大小
    Java简介
    Failed to resolve:junit:junit:4.12
  • 原文地址:https://www.cnblogs.com/northeastTycoon/p/2795923.html
Copyright © 2011-2022 走看看