13.2 设置 PL/Proxy
简短的理论介绍之后,我们可以继续前进并运行一些简单的PL/Proxy设置。要做到这一点,我们只需安装PL/Proxy并看看这是如何被使用的。
安装PL/Proxy是一件很容易的事。首先,我们要从http://pgfoundry.org/projects/plproxy/下载源代码。当然,如果对您的系统来说,预编译表是可用的话,您也可以安装二进制包。然而,在这一节中,我们将简单地从源代码执行安装,并看看事情如何在一个非常基本的水平工作。
安装过程的第一步是解压tar归档。这很容易使用如下的命令实现:
tar xvfz plproxy-2.5.tar.gz
一旦tar归档解压完毕,我们就可以进入新产生的目录,并通过调用 make && make install开始编译过程。
[请确保您的 PATH 变量指向 PostgreSQL 二进制目录。根据您当前的设置,它也可能需要还是用 root 用户运行您的安装过程 ]
如果您要确保您的安装没有问题,您也可以运行 make installcheck。它运行一些简单的测试,以确保您的系统正常运行。
13.2.1 一个基本的例子
为了让您开始,我们想以一种我们可以从所有的四个分区获得随机数的方法设置PL/Proxy。这是最基本的例子。它将展示PL/Proxy所有的基本概念。
要使用PL/Proxy,我们首先要把扩展加载到数据库:
test=# CREATE EXTENSION plproxy;
CREATE EXTENSION
这将安装所有您需要这工作的相关的代码和基础设施。然后,我们要创建四个数据库,这将存储我们要分区的数据。
test=# CREATE DATABASE p0;
CREATE DATABASE
test=# CREATE DATABASE p1;
CREATE DATABASE
test=# CREATE DATABASE p2;
CREATE DATABASE
test=# CREATE DATABASE p3;
CREATE DATABASE
一旦我们创建了这些数据库,我们就可以运行 CREATE SERVER了。现在的问题是:什么是服务器?在这个环境下,您可以把服务器作为为您提供您需要的数据的远端数据源。一个服务器总是基于一个模块(在我们的例子中,PL/Proxy),还可能带一些选项。在PL/Proxy情况下,这些选项只是一些分区;也可能有一些额外的参数,但目前为止,节点列表是这里最重要的事情:
CREATE SERVER samplecluster FOREIGN DATA WRAPPER plproxy
OPTIONS ( partition_0 'dbname=p0 host=localhost',
partition_1 'dbname=p1 host=localhost',
partition_2 'dbname=p2 host=localhost',
partition_3 'dbname=p3 host=localhost');
一旦我们创建了服务器,我们可以继续前进,并创建我们自己的用户映射。用户映射的过程是告诉系统我们在远程数据源上将是什么用户。可能会发生这种情况,在Proxy上,我们是用户A,但用户B在数据库服务器上。如果您正在使用一个外部数据封装器来来接数据库,比如 Oracle,这将是必不可少的。在PL/Proxy的情况下,用户在这些分区,Proxy也在这些分区,这是很常见的事情。
因此,我们可以如下创建一个映射:
CREATE USER MAPPING FOR hs SERVER samplecluster;
如果我们使用超级用户在系统上工作,它将是足够的。如果我们不是超级用户,我们需要给那些使用我们的虚拟服务器的用户授权。我们必须授予USAGE 权限以完成这件事。
GRANT USAGE ON FOREIGN SERVER samplecluster TO hs;
要查看我们的服务器是否已经成功创建,我们可以检查pg_foreign_server 系统表。它持有关于我们的虚拟服务器的所有相关信息。当您想知道目前有哪些分区的时候,您可以简单地咨询系统表和检查srvoptions:
test=# x
Expanded display is on.
test=# SELECT * FROM pg_foreign_server;
-[ RECORD 1 ]
srvname | samplecluster
srvowner | 10
srvfdw | 16744
srvtype |
srvversion |
srvacl | {hs=U/hs}
srvoptions | {"partition_0=dbname=p0 host=localhost","partition_1=dbna
me=p1 host=localhost","partition_2=dbname=p2 host=localhost","partitio
n_3=dbname=p3 host=localhost"}
正如我们之前提到的,PL/Proxy主要是一个存储过程语言。我们必须运行存储过程来从我们的集群获取数据。在我们的例子中,我们要在samplecluster的所有节点上运行一个简单的 SELECT 语句。
CREATE OR REPLACE FUNCTION get_random() RETURNS setof text AS $$
CLUSTER 'samplecluster';
RUN ON ALL;
SELECT random();
$$ LANGUAGE plproxy;
该过程就像是一个普通的存储过程。这里唯一的事情是,它已经被使用PL/Proxy实现了。CLUSTER 关键字将告诉系统使用哪个集群。在许多情况下,拥有多个集群是很有用的(也许,如果不同的数据集在不同不同的服务器集中)。
然后,我们必须定义在哪里运行代码。我们可以在ANY(任何服务器),ALL(所有服务器)或者在一台特定的服务器上运运行。在我们的例子中能够,我们已经决定在所有的服务器上运行了。
这里最重要的事情是,当过程被调用时,我们将从每个节点得到一行数据,因为我们使用的是 RUN ON ALL 。在 RUN ON ANY 的情况下,我们将会只得到一条数据,因为查询会在集群内部的任何一个节点上运行。
test=# SELECT * FROM get_random();
get_random
-------------------
0.879995643626899
0.442110917530954
0.215869579929858
0.642985367681831
(4 rows)
13.2.2 分区的读与写
这个例子之后,我们希望把重点放在把PL/Proxy使用到分区读区上。请记住,PL/Proxy的目的是分布我们要向外扩展的负载到多个数据库系统上。
为了演示这是如何工作的,我们希望将用户数据分发到我们的四个数据库。第一步,我们必须在集群的四个数据库上都创建一个简单的表:
p0=# CREATE TABLE t_user (
username text,
password text,
PRIMARY KEY (username)
);
NOTICE: CREATE TABLE / PRIMARY KEY will create implicit index
"t_user_pkey" for table "t_user"
CREATE TABLE
一旦我们创建了数据结构,我们就可以拿出一个过程在这个集群中实际地调度数据。一个简单的PL/proxy 过程将做这个工作:
CREATE OR REPLACE FUNCTION create_user(name text,
pass text) RETURNS void AS $$
CLUSTER 'samplecluster';
RUN ON hashtext($1);
$$ LANGUAGE plproxy;
这里的关键是,PL/Proxy将建成第一个输入的参数并在期望的节点上运行一个称为 create_user。的过程。RUN ON hashtext($1) 将是我们的分区函数。因此,这里的目标是,找到合适的节点并在该节点上执行相同的过程。所期望的节点上的最重要的部分是,create_user 过程将不会采用PL/Proxy写,而是采用简单的SQL,PL/pgSQL,或任何其它语言。PL/Proxy函数的唯一目的是找到正确的节点来执行下面的过程。
实际上把数据出入表中的每个节点上的过程是很简单的:
CREATE OR REPLACE FUNCTION create_user(name text,
pass text)
RETURNS void AS $$
INSERT INTO t_user VALUES ($1, $2);
$$ LANGUAGE sql;
这简直就是一个封装成可以在那些节点上实际工作的存储过程的 INSERT 语句。
一旦我们在所有的四个节点上部署了这个过程,我们可以尝试:
SELECT create_user('hans', 'paul');
在 test 据库中的PL/Proxy 过程将散列输入值,并计算出数据将在p3节点上,这是第四个节点:
p3=# SELECT * FROM t_user;
username | password
----------+----------
hans | paul
(1 row)
下面的SQL语句将介绍为什么第四个节点是正确的:
test=# SELECT hashtext('hans')::int4::bit(2)::int4;
hashtext
----------
3
(1 row)
请记住,我们从0开始计数,所以,第四个节点实际上是3号节点。
[请记住,分区函数可以是任何确定的程序。我们强烈地建议尽量使它简单。]
在我们的例子中,我们基于一个有相同名字的过程将在slave上执行的事实,在代理上执行了一个过程。但是,如果您要调用过程,该过程位于一个代理上,而该代理应该执行一些在期望节点上的其它过程又怎么样呢?要映射一个代理过程到其它的过程,有一个叫做 TARGET。
要把 create_user 映射到 create_new_user,只需把如下命令添加到您PL/Proxy 函数:
CREATE OR REPLACE FUNCTION create_user(name text,
pass text) RETURNS void AS $$
CLUSTER 'samplecluster';
TARGET create_new_user;
RUN ON hashtext($1);
$$ LANGUAGE plproxy;