PHP 实现多服务器共享 SESSION 数据
一、问题起源
稍大一些的网站,通常都会有好几个服务器,每个服务器运行着不同功能的模块,使用不同的二级域名,而一个整体性强的网站,用户系统是统一的,即一套用户名、密码在整个网站的各个模块中都是可以登录使用的。各个服务器共享用户数据是比较容易实现的,只需要在后端放个数据库服务器,各个服务器通过统一接口对用户数据进行访问即可。但还存在一个问题,就是用户在这个服务器登录之后,进入另一个服务器的别的模块时,仍然需要重新登录,这就是一次登录,全部通行的问题,映射到技术上,其实就是各个服务器之间如何实现共享 SESSION 数据的问题。
二、PHP SESSION 的工作原理
在解决问题之前,先来了解一下 PHP SESSION 的工作原理。在客户端(如浏览器)登录网站时,被访问的 PHP 页面可以使用 session_start() 打开 SESSION,这样就会产生客户端的唯一标识 SESSION ID(此 ID 可通过函数 session_id() 获取/设置)。SESSION ID 可以通过两种方式保留在客户端,使得请求不同的页面时,PHP 程序可以获知客户端的 SESSION ID;一种是将 SESSION ID 自动加入到 GET 的 URL 中,或者 POST 的表单中,默认情况下,变量名为 PHPSESSID;另一种是通过 COOKIE,将 SESSION ID 保存在 COOKIE 中,默认情况下,这个 COOKIE 的名字为 PHPSESSID。这里我们主要以 COOKIE 方式进行说明,因为应用比较广泛。
那么 SESSION 的数据保存在哪里呢?当然是在服务器端,但不是保存在内存中,而是保存在文件或数据库中。默认情况下,php.ini 中设置的 SESSION 保存方式是 files(session.save_handler = files),即使用读写文件的方式保存 SESSION 数据,而 SESSION 文件保存的目录由 session.save_path 指定,文件名以 sess_ 为前缀,后跟 SESSION ID,如:sess_c72665af28a8b14c0fe11afe3b59b51b。文件中的数据即是序列化之后的 SESSION 数据了。如果访问量大,可能产生的 SESSION 文件会比较多,这时可以设置分级目录进行 SESSION 文件的保存,效率会提高很多,设置方法为:session.save_path="N;/save_path",N 为分级的级数,save_path 为开始目录。当写入 SESSION 数据的时候,PHP 会获取到客户端的 SESSION_ID,然后根据这个 SESSION ID 到指定的 SESSION 文件保存目录中找到相应的 SESSION 文件,不存在则创建之,最后将数据序列化之后写入文件。读取 SESSION 数据是也是类似的操作流程,对读出来的数据需要进行解序列化,生成相应的 SESSION 变量。
三、多服务器共享 SESSION 的主要障碍及解决办法
通过了解 SESSION 的工作原理,我们可以发现,在默认情况下,各个服务器会各自分别对同一个客户端产生 SESSION ID,如对于同一个用户浏览器,A 服务器产生的 SESSION ID 是 30de1e9de3192ba6ce2992d27a1b6a0a,而 B 服务器生成的则是 c72665af28a8b14c0fe11afe3b59b51b。另外,PHP 的 SESSION 数据都是分别保存在本服务器的文件系统中。如下图所示:
确定了问题所在之后,就可以着手进行解决了。想要共享 SESSION 数据,那就必须实现两个目标:一个是各个服务器对同一个客户端产生的 SESSION ID 必须相同,并且可通过同一个 COOKIE 进行传递,也就是说各个服务器必须可以读取同一个名为 PHPSESSID 的 COOKIE;另一个是 SESSION 数据的存储方式/位置必须保证各个服务器都能够访问到。简单地说就是多服务器共享客户端的 SESSION ID,同时还必须共享服务器端的 SESSION 数据。
第一个目标的实现其实很简单,只需要对 COOKIE 的域(domain)进行特殊地设置即可,默认情况下,COOKIE 的域是当前服务器的域名/IP 地址,而域不同的话,各个服务器所设置的 COOKIE 是不能相互访问的,如 www.aaa.com 的服务器是不能读写 www.bbb.com 服务器设置的 COOKIE 的。
这里我们所说的同一网站的服务器有其特殊性,那就是他们同属于同一个一级域,如:aaa.infor96.com 和 www.infor96.com 都属于域 .infor96.com,那么我们就可以设置 COOKIE 的域为 .infor96.com,这样 aaa.infor96.com、www.infor96.com 等等都可以访问此 COOKIE。PHP 代码中的设置方法如下:
1 < ?php 2 ini_set('session.cookie_domain', '.infor96.com'); 3 ?>
这样各个服务器共享同一客户端 SESSION ID 的目的就达到了。
第二个目标的实现可以使用文件共享方式,如 NFS 方式,但设置、操作上有些复杂。我们可以参考先前所说的统一用户系统的方式,即使用数据库来保存 SESSION 数据,这样各个服务器就可以方便地访问同一个数据源,获取相同的 SESSION 数据了。
解决办法如下图所示:
四、代码实现
首先创建数据表,MySQL 的 SQL 语句如下:
CREATE TABLE `sess` (
`sesskey` varchar(32) NOT NULL default '',
`expiry` bigint(20) NOT NULL default '0',
`data` longtext NOT NULL,
PRIMARY KEY (`sesskey`),
KEY `expiry` (`expiry`)
) TYPE=MyISAM
sesskey 为 SESSION ID,expiry 为 SESSION 过期时间,data 用于保存 SESSION 数据。
默认情况下 SESSION 数据是以文件方式保存,想要使用数据库方式保存,就必须重新定义 SESSION 各个操作的处理函数。PHP 提供了session_set_save_handle() 函数,可以用此函数自定义 SESSION 的处理过程,当然首先要先将 session.save_handler 改成 user,可在 PHP 中进行设置:
1 < ?php 2 session_module_name('user'); 3 ?>
接下来着重讲一下 session_set_save_handle() 函数,此函数有六个参数:
session_set_save_handler ( string open, string close, string read, string write, string destroy, string gc )
各个参数为各项操作的函数名,这些操作依次是:打开、关闭、读取、写入、销毁、垃圾回收。PHP 手册中有详细的例子,在这里我们使用 OO 的方式来实现这些操作,详细代码如下:
1 < ?php 2 define('MY_SESS_TIME', 3600); //SESSION 生存时长 3 //类定义 4 class My_Sess 5 { 6 function init() 7 { 8 $domain = '.infor96.com'; 9 //不使用 GET/POST 变量方式 10 ini_set('session.use_trans_sid', 0); 11 //设置垃圾回收最大生存时间 12 ini_set('session.gc_maxlifetime', MY_SESS_TIME); 13 14 //使用 COOKIE 保存 SESSION ID 的方式 15 ini_set('session.use_cookies', 1); 16 ini_set('session.cookie_path', '/'); 17 //多主机共享保存 SESSION ID 的 COOKIE 18 ini_set('session.cookie_domain', $domain); 19 20 //将 session.save_handler 设置为 user,而不是默认的 files 21 session_module_name('user'); 22 //定义 SESSION 各项操作所对应的方法名: 23 session_set_save_handler( 24 array('My_Sess', 'open'), //对应于静态方法 My_Sess::open(),下同。 25 array('My_Sess', 'close'), 26 array('My_Sess', 'read'), 27 array('My_Sess', 'write'), 28 array('My_Sess', 'destroy'), 29 array('My_Sess', 'gc') 30 ); 31 } //end function 32 33 function open($save_path, $session_name) { 34 return true; 35 } //end function 36 37 function close() { 38 global $MY_SESS_CONN; 39 40 if ($MY_SESS_CONN) { //关闭数据库连接 41 $MY_SESS_CONN->Close(); 42 } 43 return true; 44 } //end function 45 46 function read($sesskey) { 47 global $MY_SESS_CONN; 48 49 $sql = 'SELECT data FROM sess WHERE sesskey=' . $MY_SESS_CONN->qstr($sesskey) . ' AND expiry>=' . time(); 50 $rs =& $MY_SESS_CONN->Execute($sql); 51 if ($rs) { 52 if ($rs->EOF) { 53 return ''; 54 } else { //读取到对应于 SESSION ID 的 SESSION 数据 55 $v = $rs->fields[0]; 56 $rs->Close(); 57 return $v; 58 } //end if 59 } //end if 60 return ''; 61 } //end function 62 63 function write($sesskey, $data) { 64 global $MY_SESS_CONN; 65 66 $qkey = $MY_SESS_CONN->qstr($sesskey); 67 $expiry = time() + My_SESS_TIME; //设置过期时间 68 69 //写入 SESSION 70 $arr = array( 71 'sesskey' => $qkey, 72 'expiry' => $expiry, 73 'data' => $data); 74 $MY_SESS_CONN->Replace('sess', $arr, 'sesskey', $autoQuote = true); 75 return true; 76 } //end function 77 78 function destroy($sesskey) { 79 global $MY_SESS_CONN; 80 81 $sql = 'DELETE FROM sess WHERE sesskey=' . $MY_SESS_CONN->qstr($sesskey); 82 $rs =& $MY_SESS_CONN->Execute($sql); 83 return true; 84 } //end function 85 86 function gc($maxlifetime = null) { 87 global $MY_SESS_CONN; 88 89 $sql = 'DELETE FROM sess WHERE expiry< ' . time(); 90 $MY_SESS_CONN->Execute($sql); 91 //由于经常性的对表 sess 做删除操作,容易产生碎片, 92 //所以在垃圾回收中对该表进行优化操作。 93 $sql = 'OPTIMIZE TABLE sess'; 94 $MY_SESS_CONN->Execute($sql); 95 return true; 96 } //end function 97 } ///:~ 98 99 //使用 ADOdb 作为数据库抽象层。 100 require_once('adodb/adodb.inc.php'); 101 //数据库配置项,可放入配置文件中(如:config.inc.php)。 102 $db_type = 'mysql'; 103 $db_host = '192.168.212.1'; 104 $db_user = 'sess_user'; 105 $db_pass = 'sess_pass'; 106 $db_name = 'sess_db'; 107 //创建数据库连接,这是一个全局变量。 108 $GLOBALS['MY_SESS_CONN'] =& ADONewConnection($db_type); 109 $GLOBALS['MY_SESS_CONN']->Connect( $db_host, $db_user, $db_pass, $db_name); 110 //初始化 SESSION 设置,必须在 session_start() 之前运行!! 111 My_Sess::init(); 112 ?>
五、遗留问题
如果网站的访问量很大的话,SESSION 的读写会频繁地对数据库进行操作,这样效率就会明显降低。考虑到 SESSION 数据一般不会很大,可以尝试用 C/Java 写个多线程的程序,用 HASH 表保存 SESSION 数据,并通过 socket 通信进行数据读写,这样 SESSION 就保存在内存中,读写速度应该会快很多。另外还可以通过负载均衡来分担服务器负载。不过这些都只是我自己的一些想法和假设,并没有实践过