本篇系C++ socket网络爬虫(1)的姊妹篇,写网络爬虫怎么能少得了线程呢
源代码地址:http://files.cnblogs.com/magicsoar/ThreadPoolProject.rar
*需要C++11的支持,在vs2013下编译通过
运行效果
背景
在传统的收到任务即创建线程的情况下,我们每收到一个任务,就创建一个线程,执行任务,销毁线程,
我们把这三个过程所用的时间分别记做T1,T2,T3
任务本身所用的时间仅占T2/(T1+T2+T3),这在任务本身所用时间很短的情况下, 效率是很低的
此外,通常操作系统所能创建的线程数量都是有限的,并不能无限制的创建线程。
而在线程池中,我们通常会预先创建m个线程,放到空闲容器中,当有任务来临时,线程池会从空闲的线程中挑选一个线程来执行该任务,
在执行完毕后再将其放回空闲容器中
C++11
在C++11中,C++对线程提供了一个很高的抽象,并没有很好的提供优先级控制等功能,需要调用std::thread::native_handle(),获取原生线程对象
运行平台特定的操作,但这就丧失了std::thread在不同平台上代码层面的一致性。
所以在项目中实现了对std::thread二次封装,并提供了基本的优先级控制
项目概述
项目中有一个主线程,即运行程序时创建的线程可以从用户那里获取任务,还有一个管理线程,用于进行线程池中线程的调度,还有初始化线程池时创建的若干空闲线程,用于执行任务
项目中主要有以下几个类:
Task:任务类,内有任务的优先级,和一个纯虚Run方法,我们需要派生Task,将要完成的任务写到Run方法中
MyThread:线程类,封装了C++11的thread,每一个线程可以关联一个Task对象,执行其Run方法
BusyThreadContainer:工作容器类,采用std::list<MyThread*>实现,储存工作状态的线程
IdleThreadContainer:空闲容器类,采用std::vector<MyThread*>实现,储存处于空闲状态的线程
TaskContainer:任务容器类,采用priority_queue<Task*>实现,储存所有用户添加未执行的任务
MyThreadPool:线程池类,用于从用户获取任务,管理任务,实现对线程池中线程的调度
类图如下
*UserTask为用户自己编写的从Task派生的任务类
Task类
namespace { enum PRIORITY { MIN = 1, NORMAL = 25, MAX = 50 }; } class Task { public: Task() { } void SetPriority(int priority) { if (priority>(PRIORITY::MAX)) { priority = (PRIORITY::MAX); } else if (priority>(PRIORITY::MAX)) { priority = (PRIORITY::MIN); } } virtual void Run() = 0; protected: int priority_; };
void SetPriority(int priority) :设置线程的优先级,数值在1-50之间,值越大,优先级越高
virtual void run() = 0:线程执行的方法,用户需要重写为自己的方法
MyThread类
class MyThread { friend bool operator==(MyThread my1, MyThread my2); friend bool operator!=(MyThread my1, MyThread my2); public: MyThread(MyThreadPool *pool); void Assign(Task *Task); void Run(); void StartThread(); int getthreadid(); void setisdetach(bool isdetach); private: MyThreadPool *mythreadpool_; static int s_threadnumber; bool isdetach_; Task *task_; int threadid_; std::thread thread_; };
方法:
MyThread(MyThreadPool *pool):构造一个MyThread对象,将自己与指定的线程池相关联起来
void Assign(Task *Task):将一个任务与该线程相关联起来
void Run():调用了Task的Run方法,同时在Task的Run方法结束后将自己从工作容器移回空闲容器
void StartThread():执行线程的Run方法,即执行了Task的Run方法
int getthreadid():获取线程的id号
void setisdetach(bool isdetach):设置线程在运行的时候是join还是detach的
BusyThreadContainer类
class BusyThreadContainer { public: BusyThreadContainer(); ~BusyThreadContainer(); void push(MyThread *m); std::list<MyThread*>::size_type size(); void erase(MyThread *m); private: std::list<MyThread*> busy_thread_container_; typedef std::list<MyThread*> Container; typedef Container::iterator Iterator; };
void push(MyThread *m):将一个线程放入工作容器中
void erase(MyThread *m):删除一个指定的线程
std::list<MyThread*>::size_type size():返回工作容器的大小
IdleThreadContainer类
class IdleThreadContainer { public: IdleThreadContainer(); ~IdleThreadContainer(); std::vector<MyThread*>::size_type size(); void push(MyThread *m); void assign(int n,MyThreadPool* m); MyThread* top(); void pop(); void erase(MyThread *m); private: std::vector<MyThread*> idle_thread_container_; typedef std::vector<MyThread*> Container; typedef Container::iterator Iterator; };
~IdleThreadContainer(); :负责析构空闲容器中的线程
void push(MyThread *m):将一个线程放回空闲容器中
void assign(int n,MyThreadPool* m):创建n个线程与线程池m相关联的线程放入空闲容器中
MyThread* top():返回位于空闲容器顶端的线程
void pop():弹出空闲容器顶端的线程
void erase(MyThread *m):删除一个指定的线程
TaskContainer类
class TaskContainer { public: TaskContainer(); ~TaskContainer(); void push(Task *); Task* top(); void pop(); std::priority_queue<Task*>::size_type size(); private: std::priority_queue<Task*> task_container_; };
void push(Task *):将一个任务放入任务容器中
Task* top():返回任务容器顶端的任务
void pop():将任务容器顶端的线程弹出
std::priority_queue<Task*>::size_type size():返回任务容器的大小
MyThreadPool类
class MyThreadPool { public: MyThreadPool(){} MyThreadPool(int number); ~MyThreadPool(); void AddTask(Task *Task,int priority); void AddIdleThread(int n); void RemoveThreadFromBusy(MyThread *myThread); void Start(); void EndMyThreadPool();private: BusyThreadContainer busy_thread_container_; IdleThreadContainer idle_thread_container_; bool issurvive_; TaskContainer task_container_; std::thread thread_this_; std::mutex busy_mutex_; std::mutex idle_mutex_; std::mutex task_mutex_; int number_of_thread_;
};
MyThreadPool(int number):构造MyThreadPool,创建包含number个线程的空闲容器
void AddTask(Task *Task,int priority):添加一个优先级为priority的任务到任务容器中
void AddIdleThread(int n):在创建n个空闲线程到空闲容器中
void RemoveThreadFromBusy(MyThread *myThread):将一个线程从工作容器中删除,并移回空闲容器中
void Start():判断是否有空闲线程,如有将任务从从任务容器中提出,放入空闲容器中,等待执行
void EndMyThreadPool():结束线程池的运行
派生自Task的MyTask类
class MyTask :public Task { friend bool operator<(MyTask &lv,MyTask &rv) { return lv.priority_ < rv.priority_; } public: MyTask(); ~MyTask(); virtual void Run(); void setdata(int d); private: int data_; };
MyTask::MyTask() { } MyTask::~MyTask() { } void MyTask::setdata(int d) { data_ = d; } void MyTask::Run() { std::cout << "Hello I am "<<data_ << std::endl; std::this_thread::sleep_for(std::chrono::seconds(1)); }
friend bool operator<(MyTask &lv,MyTask &rv) :用于确定任务在任务容器中的位置
Run:自定义的Run方法
void setdata(int d):设置数据
关键代码分析:
void MyThread::Run()
void MyThread::Run() { cout <<"Thread:"<< threadid_ << " run "; task_->Run(); mythreadpool_->RemoveThreadFromBusy(this); }
调用了Task的Run方法,同时在Task的Run方法结束后,通知线程池将自己从工作容器中移回空闲容器
void MyThread::StartThread()
void MyThread::StartThread() { thread_ = thread(&MyThread::Run, this); if (isdetach_ == true) thread_.detach(); else thread_.join(); }
将MyThread的Run方法与thread_相绑定,this表示类的Run方法的第一个隐含的参数
然后根据isdetach的值,判断是否detach() or join()
void MyThreadPool::RemoveThreadFromBusy(MyThread *myThread)
void MyThreadPool::RemoveThreadFromBusy(MyThread *myThread) { busy_mutex_.lock(); cout << "Thread:" << myThread->getthreadid()<< " remove from busylist" << endl; busy_thread_container_.erase(myThread); busy_mutex_.unlock(); idle_mutex_.lock(); idle_thread_container_.push(myThread); idle_mutex_.unlock(); }
将一个线程从任务容器中移除,并将其放回空闲容器中,
使用busy_mutex_和idle_mutex_进行加锁和解锁,确保数据的一致性
MyThreadPool::MyThreadPool(int number)
MyThreadPool::MyThreadPool(int number) { issurvive_ = true; number_of_thread_ = number; idle_thread_container_.assign(number, this); thread_this_ =thread(&MyThreadPool::Start, this); thread_this_.detach(); }
MyThreadPool的构造函数,创建number个空闲线程与空闲容器中,同时创建管理线程thread_this,用于进行线程池中线程的调度
void MyThreadPool::Start()
void MyThreadPool::Start() { while (true) { if (issurvive_==false) { busy_mutex_.lock(); if (busy_thread_container_.size()!=0) { busy_mutex_.unlock(); continue; } busy_mutex_.unlock(); break; } idle_mutex_.lock(); if (idle_thread_container_.size() == 0) { idle_mutex_.unlock(); continue; } idle_mutex_.unlock(); task_mutex_.lock(); if (task_container_.size() == 0) { task_mutex_.unlock(); continue; } Task *b = task_container_.top();; task_container_.pop(); task_mutex_.unlock(); idle_mutex_.lock(); MyThread *mythread = idle_thread_container_.top();; idle_thread_container_.pop(); mythread->Assign(b); idle_mutex_.unlock(); busy_mutex_.lock(); busy_thread_container_.push(mythread); busy_mutex_.unlock(); mythread->StartThread(); } }
管理线程对应的Start方法,内有一个死循环,不停的判断任务容器中是否有任务,和是否有空闲线程来执行任务,若有,则将任务从
任务容器中提出,从空闲线程中提取出一个空闲线程与其绑定,执行该任务,同时将该线程从空闲容器移动到工作容器中。
当线程池想要结束运行时,即survive为false时,首先要判断工作容器是否为空,若不为空,则代表还有任务正在被线程执行,线程池不能结束运行
否则可以结束线程池的运行,跳出死循环
int main()
int main() { MyThreadPool mythreadPool(10); MyTask j[50]; for (int i = 0; i < 50;i++) { j[i].setdata(i); } for (int i = 0; i < 50; i++) { mythreadPool.AddTask(&j[i],i); } int i; //按100添加一个任务 //按-1结束线程池 while (true) { cin >> i; if (i == 100) { MyTask j; j.setdata(i); mythreadPool.AddTask(&j, i); } if (i == -1) { mythreadPool.EndMyThreadPool(); break; } } system("pause"); }
创建了一个含有10个空闲线程的线程池,和50个MyTask任务,并将其放入线程池中等待运行
在循环中,用户输入100可以再添加一个任务到线程池中等待运行,输入-1结束线程池的运行。
运行结果如下
线程池使用后记
线程池并不是万能的,线程池减少了创建与销毁线程本身对任务照成的影响,但如果任务本身的运行时间很长,那么这些开销相当于任务本身执行开销而言是可以忽略的。那么我们也可以
选择“即时创建,即时销毁”的策略
线程池通常适合下面的几个场合:
(1) 单位时间内处理的任务数较多,且每个任务的执行时间较短
(2) 对实时性要求较高的任务,如果接受到任务后在创建线程,再执行任务,可能满足不了实时要求,因此必须采用线程池进行预创建。