zoukankan      html  css  js  c++  java
  • 《Windows核心编程系列》二十谈谈DLL高级技术

     本篇文章将介绍DLL显式链接的过程和模块基地址重定位及模块绑定的技术。

          第一种将DLL映射到进程地址空间的方式是直接在源代码中引用DLL中所包含的函数或是变量,DLL在程序运行后由加载程序隐式的载入,此种方式被称为隐式链接。

          第二种方式是在程序运行时,通过调用API显式的载入所需要的DLL,并显式的链接所想要链接的符号。换句话说,程序在运行时,其中的一个线程能够显式的将该DLL调用到进程地址空间中,并得到DLL中某函数的在进程地址空间的虚拟地址,然后调用该函数。此种方式被称为显式链接。

          注意:显式载入某DLL时,不需要该dll的Lib文件,且exe文件中并不包含该dll的导入表。

    显示载入DLL模块的步骤:

        线程可以调用LoadLibrary将一个DLL映射到进程地址空间。

    [cpp] view plain copy
     
    1. HMODULE LoadLibrary(PCTSTR pszDLLPathName);  


         该函数会试图对程序想载入的DLL进行定位,并试图将该DLL映射到调用进程的地址空间中。返回是DLL在调用进程的虚拟地址。即模块的句柄。如果无法将DLL载入到进程地址空间中返回值为NULL.

         与它类似的另一个函数

    [cpp] view plain copy
     
    1. HMODULE LoadLibraryEx(PCTSTR pszDLLPathName,HANDLE hFile,DWORD dwFlags);  


          也可以实现将DLL载入到进程地址空间的目的。具体请参考MSDN。

         加载后如果程序不再需要该DLL,可以调用FreeLibrary将DLL从进程地址空间中卸载:

    [cpp] view plain copy
     
    1. BOOL FreeLibrary( HMODULE  hInstDll );  


        也可以调用FreeLibraryEx卸载某DLL。

        以下函数不仅具有从进程地址空间卸载某DLL的功能,还能退出调用线程:

    [cpp] view plain copy
     
    1. VOID FreeLibraryAndExitThread(HMODULE hInstDll,DWORD dwExitCode)  
    2.   
    3. {  
    4.   
    5.  FreeLibrary(HMODULE hInstDll);  
    6.   
    7.  ExitThread(dwExitCode);  
    8.   
    9. }  


           刚见到时或许你会觉得它很多余。考虑下面的情形:

           我们调用一个DLL,该DLL中的代码会创建一个线程,当此线程完成工作后,可以调用FreeLibrary和ExitThread将DLL从进程地址空间中卸载,并终止自己。由于线程是由DLL创建的,线程执行的代码也在DLL中,当线程调用FreeLibrary将它所在的DLL卸载的时候,它后续要执行的代码已不再进程地址空间中了,试图执行不存在的代码可能会导致访问违规,导致进程被终止。

           如果线程调用FreeLibraryAndExitThread,此函数在Kernel32.dll中,FreeLibraryAndExitThread函数调用FreeLibrary将线程函数所在的DLL卸载后,其所属DLL Kernel32.dll仍在进程地址空间内,FreeLibraryAndExitThread函数继续执行调用ExitThread,后续代码仍然存在,不会导致访问违规。

           每个DLL在进程中都有一个使用计数。LoadLibrary(Ex)会增加其计数,FreeLibrary(Ex)和FreeLibraryAndExitThread会递减其计数。例如:当程序第一次调用LoadLibrary来载入一个DLL时,系统会将此DLL映射到进程地址空间中,并将此DLL的使用计数加一。如果线程后来再次调用LoadLibrary(Ex)时,系统不会将此DLL再次映射到进程地址空间,仅仅递增此DLL的使用计数。为了从进程地址空间中撤销对该DLL的映射,线程必须调用FreeLibrary(Ex)两次。第一次是将此DLL的使用计数减为1,第二次减为0。当系统发现某DLL的使用计数已经为0时,会从进程地址空间卸载此DLL。此时如果线程试图显式调用DLL中的函数将会导致访问违规。

         系统会在每个进程中为DLL维护一个使用计数,在本进程调用LoadLibrary仅仅是增加DLL在本进程的使用计数。如果进程A中的一个线程执行了LoadLibrary("Mydll.dll");进程B的某一线程也调用LoadLibrary("Mydll.dll");那么该DLL会被映射到A,B两个进程空间中去,且在A和B进程的使用计数都为1。

    调用FreeLibrary("Mydll.dll");也仅仅是递减DLL在本进程内的使用计数。

    [cpp] view plain copy
     
    1. HMODULE  GetModuleHandle(PCTSTR pszModuleName);  


          该函数可以用来检测某DLL是否被映射到了进程地址空间。如果返回值为NULL,则此DLL未被载入。

         当给pszModuleName传NULL时,函数会返回应用程序可执行文件的句柄。

     显式链接导出符号

           显式载入某个DLL后,线程可以通过调用以下函数来得到它要引用的符号的地址。

         

    [cpp] view plain copy
     
    1. FARPROC GetProcAddr(HMODULE hInstDll, PCSTR pszSymbolName);  


             hInstDll标识导出符号所在的DLL的句柄。它是LoadLibrary(Ex),或是GetModuleHandle所返回的句柄。

         pszSymbolName用于标识导出符号。

             pszSymbolName可以有两种形式:

             第一种:用符号名来指定我们想要得到哪个符号的地址。

            如:FARPROC pfn=GetProcAddress(hInstDll,"MyProc");

            它是以0结尾的字符串。要注意此字符串是ANSI类型的。因为编译器、链接器始终都是将符号的名称以ANSI字符串的形式保存在DLL的导出段。

             第二种:用序号来指定我们想要那个符号的地址。

             如:FARPROC pfn=GetProcAddress(hInstDll,MAKERESOURCE(2));

             这种方法假定我们知道某个导出符号在某DLL中的序号为2。应该明确的是Microsoft强烈反对使用序号。

    使用序号的形式要比使用字符串速度慢,因为系统需要对一字符串标识的符号名进行字符串比较。使用第二种方法即使该序号并没有与任何导出函数相对应,GetProcAddress也会返回非NULL值。其实这个地址是无效的,访问此地址可能会导致访问违规。

          注意:使用GetProcAddress返回的函数指针来调用函数之前,需要将它转换成与函数签名相匹配的类型。

         例如:

         

    [cpp] view plain copy
     
    1. typedef void (CALLBACK *PFN_DUM_MOUDLE)(MODULE hModule);  


          它是与void DynamicDumpModule(HMODULE hModule)函数相对应的函数相同。

          动态调用某DLL导出函数的例子:

    [cpp] view plain copy
     
    1. <span style="font-size:18px;"> PFN_DUMPMODULE pfnDumpModule=(PFN_DUMPMODULE)GetProcAddress(hDll,"DumpModule");  
    2.   
    3. If(pfnDumpModule!=NULL)  
    4.  {  
    5.     pfnDumpModule(hDll);  
    6.  }  
    7.   
    8. pan>  


    DLL的入口点函数

             一个DLL可以有一个入口点函数,系统会在不同的时候调用这个函数。这些调用是通知性质的,通常被DLL用来执行与进程或线程有关的初始化和清理工作。

           如果不需要执行这些操作,可以不必再源代码中不实现此函数。

           如果需要DLL接受这些通知,就应该按照如下的格式来实现该函数。

        

    [cpp] view plain copy
     
    1. <span style="font-size:18px;">Bool WINAPI DllMain(HINSTANCE hInsDll,DWORD fdwReason,PVOID fImpLoad)  
    2.   
    3. {  
    4.   
    5.      Swith(fdwReason)  
    6.   
    7.     {  
    8.   
    9.         Case DLL_PROCESS_ATTACH:  
    10.   
    11.     
    12.   
    13.              //DLL被映射到进程地址空间是,执行此处代码。  
    14.   
    15.                 Break;  
    16.   
    17.          Case DLL_THREAD_ATTACH:  
    18.   
    19.              //线程被创建的时候执行。  
    20.   
    21.                  Break;  
    22.   
    23.          Case DLL_THREAD_DETACH:  
    24.   
    25.                //线程终止运行时执行。  
    26.   
    27.                    Break;  
    28.   
    29.          Case DLL_PROCESS_DETACH:  
    30.   
    31.                 //DLL被卸载的时候执行。  
    32.   
    33.                     Break;  
    34.   
    35.        }  
    36. }  
    37.   
    38. </span>  


              hInstDll是该DLL实例的句柄。它是DLL文件被映射到进程地址空间的虚拟地址。通常将这个参数保存在全局变量中。这样在DLL的其他导出函数中就可以使用。

            如果DLL是被隐式载入的,fImpLoad为非零值,显式的话fImportLoad为0。

            fdwReason表示系统调用入口点函数的原因。它是switch语句的参数。可以是上述四个值。分别表示四种情况。后续将会详细介绍每一种情况。

              注意:DLL使用DllMain对自己进行初始化。DllMain执行的时候,其他DLL的可能还未被初始化。这意味着我们应该避免在DllMain中调用从其他DLL中导出的函数。

    DLL_PROCESS_ATTACH通知

             当系统第一次将一个DLL映射到进程地址空间是,会调用DllMain函数,并给fdwReason传入DLL_PROCESS_ATTACH。注意:只有在该DLL是第一次被调用到进程地址空间中时,才会调用DllMain。如果以后再次调用LoadLibrary(Ex)时,OS仅仅是递增该DLL在此进程的使用计数,并不会再次调用DllMain。

             当DLL在处理DLL_PROCESS_ATTACH时,应该根据需要执行与进程相关的初始化。如DLL中包含一些函数,需要使用自己的堆,可以在进程加载时执行一些堆的初始化工作。

    处理DLL_PROCESS_ATTACH时,DllMain的返回值表示DLL的初始化是否成功。如初始化成功,应返回TRUE,否则应返回false。

           下面来看看DllMain调用的时机:

            创建新进程时,系统为该进程分配地址空间,并将exe可执行文件和所需要的DLL映射到进程地址空间。然后创建主线程,并用主线程来调用每个DLL的DllMain函数,同时传入DLL_PROCESS_ATTACH。当所有已映射的DLL完成对该通知的处理后,系统会让主进程执行可执行模块的C/C++运行库的启动代码。然后执行可执行模块的入口点函数(_tmain或_tWinMain)。如果任意一个DLL的DllMain返回false,就说明初始化失败,系统会将所有文件映像从地址空间中清除,向用户显示错误信息。

    显式载入DLL的过程:

             进程调用LoadLibrary(Ex),该函数对DLL进行定位,并将该DLL映射到进程地址空间。然后会让调用LoadLibrary(Ex)的线程调用DllMain函数,并传入DLL_PROCESS_ATTACH。当DLL的DllMain函数完成了对通知的处理后,系统会让LoadLibrary返回。这样线程就可以继续执行。

             注意:DllMain是在进程调用LoadLibrary(Ex)的时候调用的。它返回到LoadLibrary(Ex)函数内。

    DLL_PROCESS_ATTACH通知

           当一个DLL从进程的地址空间中撤销的时候,会调用该DLL的DllMain函数,并在fdwReason传入DLL_PROCESS_DETACH。该case语句内一般是用来执行与进程相关的清理工作。如调用HeapDestroy清理堆。

             注意:当DLL刚被映射到进程地址空间,执行DllMain并传入DLL_PROCESS_ATTACH时的返回值为false时,所有DLL将会被撤销映射,此时并不会调用DllMain并传入DLL_PROCESS_DETACH。

           下面谈谈调用DllMain并传入DLL_PROCESS_DETACH的时机:

            1:当进程又由于某线程调用ExitProcess而终止时,映射到该进程的所有DLL都会被撤销。调用 ExitProcess的线程将负责执行DllMain。一般情况下,此线程就是主线程。

            2:如果DLL被撤销的原因是因为进程中的线程调用了FreeLibrary或是FreeLibraryAndExitThread,那么执行上述函数的线程将负责对DllMain的调用。调用完成后线程返回,继续执行其他代码。

            注意:如果进程终止是因为某个线程调用TerminateProcess,此时DllMain并不会被调用。这意味着在进程终止前,已经映射到进程的任何DLL将没有任何机会执行清理工作,这可能导致数据丢失或是已被该进程占用的信号量不能得到释放。因此不到万不得已,应该避免使用TerminageProcess。

    DLL_THREAD_DEATTACH通知

            当进程创建一线程的时候,系统会检查已映射到此进程的所有DLL,并用DLL_THREAD_ATTACH调用每个DLL的DllMain。一般在此时执行与线程有关的初始化。DllMain的代码是由新创建的线程执行。当该线程完成了所有DllMain之后,才会执行它的线程函数。

            注意:仅仅是让新建的线程执行已经被映射到进程地址空间的DLL的DllMain函数。而不会让已经存在的线程调用DllMain。当系统的主线程被创建的时候,并不会调用DllMain并传入DLL_PROCESS_ATTACH。它已经在进程被创建的时候调用DllMain并传入DLL_PROCESS_ATTACH。

    DLL_THREAD_DETACH通知

             当线程调用ExitThread将要终止的时候,系统会让该线程用DLL_THREAD_DETACH调用所有已映射到进程地址空间的所有DLL的DllMain函数。这一般被用来执行与线程相关的清理工作。

             注意:如果线程终止是因为其他线程调用TerminateThread而终止的话,系统不会用DLL_THREAD_DETACH让线程调用各DLL的DllMain。因此与TerminateProcess一样,除非万不得以,应避免使用TerminateThread函数。

           下面来总结下调用DllMain的过程:

            进程中的一个线程调用LoadLibrary来映射一个DLL,系统使该线程用DLL_PROCESS_ATTCH调用该DLL的DllMain函数(该线程不会得到DLL_THREAD_ATTACH)通知。当此线程退出时,系统让此线程再次调用所有DLL的DllMain函数,但此次传入的是DLL_THREAD_DETACH。虽然在该DLL映射的时候,不会向该DLL发送DLL_THREAD_ATTACH通知。但是当该线程退出时,会向DLL发送DLL_THREAD_DETACH通知。

    之所以不发送DLL_PROCESS_DETACH通知,是因为DLL仍在进程中。只有当DLL被卸载时,才会发送此通知。

            前面我们提到过DllMain函数并不是必须的。在链接DLL的时候,如果链接器无法在obj文件中发现DllMain函数,它会链接C/C++运行库的DllMain函数。如果我们不提供DllMain函数,C/C++运行库会认为我们不关系DLL的各种通知。它会调用DisableThreadLibraryCalls函数。

    [cpp] view plain copy
     
    1. <span style="font-size:18px;">     BOOL DisableThreadLibraryCalls(HMODULE hInstDll);  
    2.   
    3. </span>  


              该函数告诉系统  我们不想让系统向某个指定的DLL发送DLL_THREAD_ATTACH和DLL_THREAD_DETACH通知。

             C/C++运行库中实现的DllMain函数如下所示:

    [cpp] view plain copy
     
    1. <span style="font-size:18px;">    BOOL WINAPI DllMain(HINSTANCE hInstDll,DWORD fdwReason,PVOID fImpLoad)  
    2.   
    3.     {  
    4.   
    5.         if(fdwReason==DLL_PROCESS_ATTACH)  
    6.   
    7.            DisableThreadLibraryCalls(hInstDll);  
    8.   
    9.         return true;  
    10.   
    11.     }  
    12.   
    13. </span>  

    延迟载入DLL。

             所谓延迟载入DLL,就是在进程运行后加载程序加载各种DLL时,并不载入已经被设为延迟加载的DLL。直到该DLL中的某个导出函数被调用的时候,此DLL才会被加载到进程的地址空间中。该DLL是隐式链接的 。

            这项特性非常有用,主要应用与以下各种情况下:

            1:某进程使用了很多DLL,由于初始化时加载程序必须将所有DLL都映射到进程地址空间中,这会导致加载速度比较慢。如果使用延迟加载,某些DLL直到其导出符号被引用到的时候,该DLL才会被隐式加载到进程地址空间,这缩短了初始化时间。

            2:当应用程序在代码上使用了一个新的函数,运行在不提供此函数的老版本的系统上时,如果该函数所在的DLL不使用延迟加载机制,加载程序会报告一个错误:无法找到该函数。接着便会终止该应用程序的执行。如果我们使用延迟加载技术,当程序检测到此时是运行在老的系统中,程序就不会调用此函数,转而使用可以在老的系统上使用的其它函数。程序仍然可以继续运行。由于不会在程序中引用在老系统中不支持的函数,该函数所在的DLL就不会被加载。

            当然任何方法都有适用范围,延迟加载不适用于以下几种情况:

           1:导出全局变量的DLL是无法延迟加载的。

           2:Kernel32.dll是无法延迟加载的,LoadLibrary和GetProcAddress都在该模块中。必须加载该模块才可以调用它们。

            3:不应该在DllMain中代用延迟加载函数,这样会导致程序崩溃。

             要让延迟加载能够正常工作,首先要指定两个链接器开关。

            /Lib:DelayImp.dl

            /DelayLoad:要延迟加载的DLL名字。

            它们不可以在代码中通过#pragma comment(linker,"")来设定。而要通过Configuration Properities属性页来设定。

            /Lib:DelayImp.dll是通过Linker/Advanced/DelayLoadDLL开关来指定。它告诉链接器将函数_delay_LoadHelper2嵌入到我们的可执行文件中。

             /DelayLoad开关可以通过Linker /input/DelayLoadDLLs开关来指定。要延迟载入的函数所在的DLL在该项的右侧指定。可以指定多个延迟载入DLL。

          该开关告诉链接器::

          1:将用户要延迟载入的DLL从可执行文件的导入段中去除,这样当进程初始化时该DLL就不会被隐式的载入。

          2:在可执行文件中嵌入一个延迟载入段,来表示要从用户要延迟载入的DLL导入哪些函数。

          3:当程序调用延迟载入DLL中的函数时,对该函数的调用会转到_delayLoadHelper2函数,来完成对延迟载入函数的解析。也就是说对延迟载入段中的函数的调用,实际上会调用_delayLoadHelper2函数。此函数会引用延迟载入段,然后调用LoadLibrary和GetProcAddress得到延迟载入函数的地址。一旦得到延迟载入函数的地址_delayLoadHelper2就会修复对该函数的调用(Windows核心编程的原话,至于如何修复不清楚。2011年12月8日注)。今后的调用将直接调用该延迟载入函数。注意:同一个DLL的其它函数仍然必须在第一次被调用的时候修复。对同一DLL中某一延迟函数的调用并不会对其他延迟函数的调用进行修复

    关于延迟载入函数暂时介绍这么多。感兴趣的话可以参考其他文献。

          《参考自windows核心编程》第五版第四部分。以上仅仅是个人总结,如有纰漏请不吝赐教!

  • 相关阅读:
    P1119 灾后重建
    P1453 城市环路
    21.10.28模拟 C
    21.10.28模拟 String Coloring AGC26 C
    P1155 [NOIP2008 提高组] 双栈排序
    21.10.27模拟 solve
    21.10.27模拟 P4157 [SCOI2006]整数划分
    P2168 [NOI2015] 荷马史诗
    P3052 [USACO12MAR]Cows in a Skyscraper G
    P2533 [AHOI2012]信号塔 P1742 最小圆覆盖
  • 原文地址:https://www.cnblogs.com/weekbo/p/9054549.html
Copyright © 2011-2022 走看看