近期项目中遇到了一个处理速度慢阻塞用户界面操作的问题,因此想用多线程来解决。
在处理数据的循环中,新建线程,在新建的线程中处理数据。多线程同一时候处理数据,以此来达到加速的目的,使用户界面操作变得流畅。
在多任务操作系统中。我们能够在操作系统的协调下同一时候进行多个任务。各个任务以分时复用的形式来进行工作。
Windows操作系统通过进程ID来管理各进程。每一个进程至少包括一个线程。线程是进程中能够独立执行的程序片段。在主程序执行时,主程序能够启动线程。线程与主程序同一时候执行。
线程是系统中分时处理的最小单位,也就是说线程能够与主程序并行执行。參与同分时处理。线程有自己独立的栈处理数据。它在与主程序同一时候执行时能够共享主程序定义的变量、函数。仅仅有当线程执行结束才把控制权还给主程序。
创建线程最直接的方法是创建新的线程类实例,并使用Address Of语句为执行的过程传递托付。
可是这样的方法不能传递參数和返回值。
我们能够通过将在单独的线程中执行的过程包装到类或结构中。为它们提供參数,并使之能返回參数。
以下是一个新建线程的小demo:
Class TasksClass Public StrArg As String Public RetVal As Boolean Public resultFlag As Boolean Public Event ResultEvent(ByVal resultFlag As Boolean) Public Sub SomeTask() ' 将 StrArg 字段用作參数。 MessageBox.show("StrArg 包括字符串" & StrArg) RetVal = True ' 设置返回參数的返回值。End Sub End Class
Public Class Test Private Sub Test_Load(sender As Object, e As EventArgs) Handles MyBase.Load DoWork() End Sub ' 要使用类。请设置存储參数的属性或字段, ' 然后。依据须要异步调用方法。Sub DoWork() Dim Tasks As New TasksClass() Dim Thread1 As New System.Threading.Thread(AddressOf Tasks.SomeTask) Tasks.StrArg = "參数A" ' 设置用作參数的字段。 Thread1.Start() ' 启动新线程。 Thread1.Join() ' 等待线程 1 执行结束。
' 显示返回值。
MessageBox.show("线程 1 返回值" & Tasks.RetVal) End Sub End Class
这样一个线程就被新建出来了。
可是其实。创建过多的线程反而会影响性能。由于各个线程之间是分时复用的,操作系统须要在它们之间不断的切换。线程过多的时候,大量的时间消耗在线程切换上。
所以须要控制线程的数量。
如果我们仅仅新建10个线程,剩余的数据等待这10个线程中的某个结束,再继续新建线程处理数据。
使线程的总数一直保持在10个。
Public Class ThreadingObj Public paper As WorkSpace Public Sub ThreadingInsertPaper() '多线程处理数据 End Sub End Class Private PaperList As List(Of WorkSpace) = New List(Of WorkSpace) Dim ThreadingList As List(Of System.Threading.Thread) = New List(Of System.Threading.Thread)
For Each paper In PaperList '多线程处理PaperList If ThreadingList.Count < 10 Then '不到10个线程则继续新起线程 Dim ThreadingObject As New ThreadingObj Dim ThreadingTask_1 As New System.Threading.Thread(AddressOf ThreadingObject.ThreadingInsertPaper) ThreadingObject.paper = paper ThreadingList.Add(ThreadingTask_1) ThreadingTask_1.Start() ' 启动新线程。 Else Dim goOnFlag As Boolean = False '循环等待有线程结束 Do If CheckThreadingStatus() Then '存在已完毕的线程 If ThreadingList.Count <= 10 Then Dim ThreadingObject As New ThreadingObj Dim ThreadingTask_1 As New System.Threading.Thread(AddressOf ThreadingObject.ThreadingInsertPaper) ThreadingObject.paper = paper ThreadingList.Add(ThreadingTask_1) ThreadingTask_1.Start() ' 启动新线程。 goOnFlag = True End If Else '全部线程都在进行中 End If Loop Until goOnFlag = True End If Next
Function CheckThreadingStatus() As Boolean '返回True表示存在已完毕的线程 If ThreadingList.Count <= 10 Then For Each ThreadingTaskItem In ThreadingList 'ThreadingTaskItem.IsAlive If ThreadingTaskItem.IsAlive = False Then ThreadingTaskItem.Abort() ThreadingList.Remove(ThreadingTaskItem) Return True End If Next End If Threading.Thread.Sleep(100) If ThreadingList.Count <= 10 Then For Each ThreadingTaskItem In ThreadingList If ThreadingTaskItem.IsAlive = False Then Return True End If Next End If Return False End Function
如果操作系统中有50个活跃的线程。如果我们的程序仅仅有一个线程。那么程序就占用了系统资源的五十分之中的一个。如果此时再多开一个线程,那么就占用了系统资源的2/51。我们的程序占用的资源越多。处理速度也就会更快一些。
由于各个线程之间是分时复用的,所以活跃的线程数量也会影响程序的效率。
有一种说法是2N + 2个线程数。是最有效率的。N是CPU的核数。
可是这一说法也一直存在争议。
我的測试结果例如以下(我的电脑是i7 4770 。四核八线程):
线程数 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 15 |
耗时 | 753 | 409 | 345 | 316 | 305 | 286 | 280 | 282 | 273 | 273 | 264 | 266 |
測试的结果有点奇怪。。
。
。
。。
。
可能跟一些其它的因素也有关系。
。
。
比方DB的状态,比方浏览网页对CPU的占用