zoukankan      html  css  js  c++  java
  • PHP内核研究:HASH表和变量 【转】

    PHP HASH表

    在PHP中,所有的数据 无论变量,常量,类,属性 都用Hash表来实现.

    先要说说 HASH表

     

    1. typedef struct bucket { 
    2.         ulong h;                                                /* Used for numeric indexing */ 
    3.         uint nKeyLength; //key长度 
    4.         void *pData; //指向 Bucke保存的数据 指针 
    5.         void *pDataPtr; //指针数据 
    6.         struct bucket *pListNext; //下一个元素指针 
    7.         struct bucket *pListLast;//上一个元素指针 
    8.         struct bucket *pNext; 
    9.         struct bucket *pLast; 
    10.         char arKey[1]; /* Must be last element */ 
    11. } Bucket; 
    12. typedef struct _hashtable { 
    13.         uint nTableSize;//HashTable的大小 
    14.         uint nTableMask;//等于nTableSize-1 
    15.         uint nNumOfElements;//对象个数 
    16.         ulong nNextFreeElement;//指向下一个空元素位置 nTableSize+1 
    17.         Bucket *pInternalPointer;       /* Used for element traversal *///保存当前遍历的指针 
    18.         Bucket *pListHead;//头元素指针 
    19.         Bucket *pListTail;//尾元素指针 
    20.         Bucket **arBuckets;//存储hash数组数据 
    21.         dtor_func_t pDestructor;//类似于析构函数 
    22.         zend_bool persistent;//用哪种方法分配内存空间 PHP统一管理内存还是用普通的malloc 
    23.         unsigned char nApplyCount;//当前hash bucket被访问的次数,是否遍历过数据,防止无限递归循环 
    24.         zend_bool bApplyProtection; 
    25. #if ZEND_DEBUG 
    26.         int inconsistent; 
    27. #endif 
    28. } HashTable; 

    我们结合 HASH表初始化函数来说

    1. ZEND_API int _zend_hash_init(HashTable *ht, uint nSize, hash_func_t pHashFunction, dtor_func_t pDestructor, zend_bool persistent ZEND_FILE_LINE_DC) 
    2.  uint i = 3; 
    3.  Bucket **tmp; 
    4.   
    5. SET_INCONSISTENT(HT_OK); 
    6.   
    7.  if (nSize >= 0x80000000) { //HASH表大小大于0x8则初始化为0x8 
    8.        /* prevent overflow */ 
    9.        ht->nTableSize = 0x80000000; 
    10.  } else { 
    11.        while ((1U << i) < nSize) { //调整为 2的n次方          i++;        }        ht->nTableSize = 1 << i;//HASH bucket大小   为 2的i次方  i=3 ,nTableSize最小值为8 
    12.  } 
    13. //为了提高计算效率,系统自动会将nTableSize调整到最小一个不小于nTableSize的2的整数次方。也就是说,如果在初始化HashTable时指定一个nTableSize不是2的整数次方,系统将会自动调整nTableSize的值 <!--EndFragment--> 
    14.   
    15.  ht->nTableMask = ht->nTableSize - 1; 
    16.  ht->pDestructor = pDestructor;//一个函数指针,当HashTable发生增,删,改时调用 
    17.  ht->arBuckets = NULL; 
    18.  ht->pListHead = NULL; 
    19.  ht->pListTail = NULL; 
    20.  ht->nNumOfElements = 0; 
    21.  ht->nNextFreeElement = 0; 
    22.  ht->pInternalPointer = NULL; 
    23.  ht->persistent = persistent;//如果persisient为TRUE,则使用操作系统本身的内存分配函数为Bucket分配内存,否则使用PHP的内存分配函数 
    24.  ht->nApplyCount = 0; 
    25.  ht->bApplyProtection = 1; 
    26.   
    27.  /* Uses ecalloc() so that Bucket* == NULL */ 
    28.  if (persistent) {  //操作系统本身内存分配方式分配内存,calloc分配内存后自动初始化为0 
    29.  tmp = (Bucket **) calloc(ht->nTableSize, sizeof(Bucket *)); 
    30.  if (!tmp) { 
    31.  return FAILURE; 
    32.  } 
    33.  ht->arBuckets = tmp; 
    34.  } else {//用PHP的内存管理机制分配内存 
    35.  tmp = (Bucket **) ecalloc_rel(ht->nTableSize, sizeof(Bucket *)); 
    36.  if (tmp) { 
    37.  ht->arBuckets = tmp; 
    38.  } 
    39.  } 
    40. //自动申请一块内存给arBuckets,该内存大小等于 nTableSize 
    41. return SUCCESS; 

        在读源码的时候 ,经常会看到 EG,PG,CG这样的宏

    CG是 compile_global的简写

    EG是excutor_global的简写

    G就是全局变量的意思

    我们就以EG宏为例

     

    1. #ifdef ZTS 
    2. # define EG(v) TSRMG(executor_globals_id, zend_executor_globals *, v) 
    3. #else 
    4. # define EG(v) (executor_globals.v) 
    5. extern ZEND_API zend_executor_globals executor_globals; 
    6. #endif 

     

    很简单 只是一个获取全局变量的宏

    那么我们看看 zend_executor_globals这个结构体

    在/Zend/zend.h里面定义

    typedef struct _zend_executor_globals zend_executor_globals;

    是一个 _zend_executor_globals的别名

    同一个文件里找到它

    PHP的所有 局部变量,全局变量,函数,类的 Hash表 都在这里定义了

     

    1. struct _zend_executor_globals { 
    2. zval **return_value_ptr_ptr; 
    3.   
    4. zval uninitialized_zval; 
    5. zval *uninitialized_zval_ptr; 
    6.   
    7. zval error_zval; 
    8. zval *error_zval_ptr; 
    9.   
    10. zend_ptr_stack arg_types_stack; 
    11.   
    12. /* symbol table cache */ 
    13. HashTable *symtable_cache[SYMTABLE_CACHE_SIZE]; 
    14. HashTable **symtable_cache_limit; 
    15. HashTable **symtable_cache_ptr; 
    16.   
    17. zend_op **opline_ptr; 
    18.   
    19. HashTable *active_symbol_table;  //局部变量 
    20. HashTable symbol_table; /* main symbol table */ //全局变量 
    21.   
    22. HashTable included_files; /* files already included */ //include的文件 
    23.   
    24. JMP_BUF *bailout; 
    25.   
    26. int error_reporting; 
    27. int orig_error_reporting; 
    28. int exit_status; 
    29.   
    30. zend_op_array *active_op_array; 
    31.   
    32. HashTable *function_table; /* function symbol table */ //函数表 
    33. HashTable *class_table; /* class table */ //类表 
    34. HashTable *zend_constants; /* constants table */ //常量表 
    35.   
    36. zend_class_entry *scope; 
    37. zend_class_entry *called_scope; /* Scope of the calling class */ 
    38.   
    39. zval *This; 
    40.   
    41. long precision; 
    42.   
    43. int ticks_count; 
    44.   
    45. zend_bool in_execution; 
    46. HashTable *in_autoload; 
    47. zend_function *autoload_func; 
    48. zend_bool full_tables_cleanup; 
    49.   
    50. /* for extended information support */ 
    51. zend_bool no_extensions; 
    52.   
    53. #ifdef ZEND_WIN32 
    54. zend_bool timed_out; 
    55. OSVERSIONINFOEX windows_version_info; 
    56. #endif 
    57.   
    58. HashTable regular_list; 
    59. HashTable persistent_list; 
    60.   
    61. zend_vm_stack argument_stack; 
    62.   
    63. int user_error_handler_error_reporting; 
    64. zval *user_error_handler; 
    65. zval *user_exception_handler; 
    66. zend_stack user_error_handlers_error_reporting; 
    67. zend_ptr_stack user_error_handlers; 
    68. zend_ptr_stack user_exception_handlers; 
    69.   
    70. zend_error_handling_t error_handling; 
    71. zend_class_entry *exception_class; 
    72.   
    73. /* timeout support */ 
    74. int timeout_seconds; 
    75.   
    76. int lambda_count; 
    77.   
    78. HashTable *ini_directives; 
    79. HashTable *modified_ini_directives; 
    80.   
    81. zend_objects_store objects_store; 
    82. zval *exception, *prev_exception; 
    83. zend_op *opline_before_exception; 
    84. zend_op exception_op[3]; 
    85.   
    86. struct _zend_execute_data *current_execute_data; 
    87.   
    88. struct _zend_module_entry *current_module; 
    89.   
    90. zend_property_info std_property_info; 
    91.   
    92. zend_bool active; 
    93.   
    94. void *saved_fpu_cw; 
    95.   
    96. void *reserved[ZEND_MAX_RESERVED_RESOURCES]; 
    97. }; 

     

    这里先简单看看,以后用到的时候再细说,

      • PHP里最基本的单元 变量:
        在PHP里 定义一个变量 再简单不过了
    1. <?php 
    2. $a=1; 
    3. ?> 

    但是在内核中 它是用一个 zval结构体实现的
    如上面定义变量 在内核中则执行了下面这些代码

     

    1. zval *val; 
    2. MAKE_STD_ZVAL(val);  //申请一块内存 
    3. ZVAL_STRING(val,"hello",1);//用ZVAL_STRING设置它的值为 "hello" 
    4. ZEND_SET_SYMBOL(EG(active_symbol_table),"a",val));//将  val指针加入到符号表里面去 

    宏 MAKE_STD_ZVAL 定义如下

     

    1. #define MAKE_STD_ZVAL(zv)                                 
    2. ALLOC_ZVAL(zv);   //它归根到底等于 (p) = (type *) emalloc(sizeof(type)) 
    3. INIT_PZVAL(zv); 

    INIT_PZVAL定义在

     

    1. #define INIT_PZVAL(z)            看得出它是初始化参数 
    2. (z)->refcount__gc = 1;   
    3. (z)->is_ref__gc = 0; 

    那么 zval到底是什么呢
    在zend/zend.h里面
    typedef struct _zval_struct zval; //原来它是 _zval_struct 的别名
    _zval_struct 定义如下

     

    1. typedef union _zvalue_value { 
    2.         long lval;  //保存long类型的数据 
    3.         double dval; //保存 double类型的数据 
    4.         struct { 
    5.                 char *val; //真正的值在这里 
    6.                 int len;   //这里返回长度 
    7.         } str; 
    8.         HashTable *ht; 
    9.         zend_object_value obj; //这是一个对象 
    10. } zvalue_value; 
    11.   
    12. struct _zval_struct { 
    13. zvalue_value value;             //保存的值 
    14. zend_uint refcount__gc;//被引用的次数 如果为1 则只被自己使用如果大于1 则被其他变量以&的形式引用. 
    15. zend_uchar type;       //数据类型 这也是 为什么 PHP是弱类型的原因 
    16. zend_uchar is_ref__gc;  //表示是否为引用 
    17. }; 

    如果还是不够清楚..那么我们实战一下..用C来创建一个PHP变量
    这里需要一个扩展,PHP如果用C扩展模块 这里就不说了
    关键代码

     

    1. PHP_FUNCTION(test_siren){ 
    2.         zval *value; 
    3.         char *s="create a php variable"; 
    4.         value=(zval*)malloc(sizeof(zval)); 
    5.         memset(value,0,sizeof(value)); 
    6.         value->is_ref__gc=0; //非引用变量 
    7.         value->refcount__gc=1;//引用次数 只有自己 
    8.         value->type=IS_STRING;//类型为字符串 
    9.         value->value.str.val=s;//值 
    10.         value->value.str.len=strlen(s);//长度 
    11.         ZEND_SET_SYMBOL(EG(active_symbol_table),"a",value); 

    第三行和第四行的作用 与MAKE_STD_ZVAL的作用相同,给value分配内存空间
    第5-9行 的作用与ZVAL_STRING的作用相同,
    最后一行 是将value创建一个 在PHP里叫$a的变量..并添加到局部Hash表里..
    这样 在PHP里

     

    1. <?php 
    2. test_siren(1); 
    3. echo $a; 
    4. ?> 

    就会输出 “create a php variable”
    OK,
    大功告成
    注意,我是为了让大家看到PHP内部创建变量的流程 才采用C的形式创建变量,
    绝对不推荐大家这样做.
    还是一定要用PHP内部的内存管理机制分配并处理内存。

    来自:http://blog.51cto.com/imsiren/1128808

  • 相关阅读:
    S1-概论
    AngularJS--day01介绍使用基本语法
    原生ajax--2
    原生ajax---1
    操作元素--字符串对象-日期对象-Array对象(数组)-Math对象-计时器
    HTTP协议系列教材 (三)- 通过Firefox火狐调试工具观察 HTTP 请求协议
    HTTP协议系列教材 (二)- 借助FireFox火狐调试工具学习HTTP协议
    HTTP协议系列教材 (一)- 教程
    Servlet系列教材 (二十七)- JSON
    Servlet系列教材 (二十六)- JSON
  • 原文地址:https://www.cnblogs.com/ghjbk/p/8037510.html
Copyright © 2011-2022 走看看