在这一节和接下来的小节中,我们会描述PL/pgSQL能明确理解的所有语句类型。任何不被识别为这些语句类型之一的被假定为是一个 SQL 命令,并且会被发送给主数据库引擎执行,具体如第 43.5.2 节中所述。
为一个PL/pgSQL变量赋一个值可以被写为:
variable
{ := | = }expression
;
正如以前所解释的,这样一个语句中的表达式被以一个 SQL
SELECT
命令被发送到主数据库引擎的方式计算。
该表达式必须得到一个单一值(如果该变量是一个行或记录变量,
它可能是一个行值)。该目标变量可以是一个简单变量(
可以选择用一个块名限定)、一个行或记录变量的域或是一个简单
变量或域的数组的元素或者数组的切片。
等号(=
)可以被用来代替 PL/SQL-兼容的
:=
。
如果该表达式的结果数据类型不匹配变量的数据类型,该值将被强制为变量 的类型,就好像做了赋值造型一样(见第 10.4 节)。 如果没有用于所涉及到的数据类型的赋值造型可用, PL/pgSQL解释器将尝试以文本的方式转换结果值,也就 是在应用结果类型的输出函数之后再应用变量类型的输入函数。注意如果结果 值的字符串形式无法被输入函数所接受,这可能会导致由输入函数产生的运行 时错误。
例子:
tax := subtotal * 0.06; my_record.user_id := 20; my_array[j] := 20; my_array[1:3] := array[1,2,3]; complex_array[n].realpart = 12.3;
通常,任何不返回行的 SQL 命令,你可以通过把该命令直接写在一个 PL/pgSQL 函数中执行它。 例如,创建和填充表数据,你可以这样写:
CREATE TABLE mytable (id int primary key, data text); INSERT INTO mytable VALUES (1,'one'), (2,'two');
如果命令返回行 (例如 SELECT
,
或者 INSERT
/UPDATE
/DELETE
带有 RETURNING
的命令),有两种方式处理。
当命令最多返回一行,或者你只关心第一行的输出时,像往常一样编写命令,但要添加一个INTO
子句来捕获输出,如第 43.5.3 节中所述。为了处理所有的输出行,把命令写成FOR
循环的数据源,如 第 43.6.6 节中所述。
简单地执行静态定义的 SQL 命令通常是不够的。通常,您会希望使用使用可变数据值的命令,或者甚至以更基本的方式进行更改,例如在不同时间使用不同的表名。同样,有两种方法,视情况而定。
PL/pgSQL 变量值可以自动插入到可优化的SQL命令中,这些命令是SELECT
、INSERT
、UPDATE
、DELETE
,以及某些包含其中之一的实用命令,例如EXPLAIN
和CREATE TABLE ... AS SELECT
。 在这些命令中,任何出现在该命令文本中的PL/pgSQL变量名被查询参数替换,并且接着该变量的当前值被提供为运行时该参数的值。这与早前描述的对表达式的处理完全相似,详见第 43.11.1 节。
当以这种方式执行一个可优化的 SQL 命令时,如第 43.11.2 节中讨论的,PL/pgSQL会为该命令缓存并重用执行计划。
不可优化的SQL命令(也称为实用命令)不能够接受查询参数。 所以自动替换PL/pgSQL的变量在这类命令中不起作用。 要在从PL/pgSQL执行的实用程序命令中包含非常量文本,你必须将实用程序命令构建为一个字符串,然后EXECUTE
它,如第 43.5.4 节中所讨论的。
EXECUTE
也必须使用,如果你想以某种其他方式修改命令,而不是提供数据值,例如改变表名。
有时候计算一个表达式或SELECT
查询但抛弃其结果是有用的,例如调用一个有副作用但是没有有用的结果值的函数。在PL/pgSQL中要这样做,可使用PERFORM
语句:
PERFORM query
;
这会执行query
并且丢弃掉结果。以写一个SQL SELECT
命令相同的方式写该query
,并且将初始的关键词SELECT
替换为PERFORM
。对于WITH
查询,使用PERFORM
并且接着把该查询放在圆括号中(在这种情况中,该查询只能返回一行)。PL/pgSQL变量将被替换到该查询中,正如上面描述的查询,并且计划被以相同的方式被缓存。还有,如果该查询产生至少一行,特殊变量FOUND
会被设置为真,而如果它不产生行则设置为假(见第 43.5.5 节)。
我们可能期望直接写SELECT
能实现这个结果,但是当前唯一被接受的方式是PERFORM
。一个能返回行的 SQL 命令(例如SELECT
)将被当成一个错误拒绝,除非它像下一节中讨论的有一个INTO
子句。
一个例子:
PERFORM create_mv('cs_session_page_requests_mv', my_query);
一个产生单一行(可能有多个列)的 SQL 命令的结果可以被赋值给一个记录变量、行类型变量或标量变量列表。这通过书写基础 SQL 命令并增加一个INTO
子句来达成。例如:
SELECTselect_expressions
INTO [STRICT]target
FROM ...; INSERT ... RETURNINGexpressions
INTO [STRICT]target
; UPDATE ... RETURNINGexpressions
INTO [STRICT]target
; DELETE ... RETURNINGexpressions
INTO [STRICT]target
;
其中target
可以是一个记录变量、一个行变量或一个有逗号分隔的简单变量和记录/行域列表。PL/pgSQL变量将被替换到该命令的剩余部分中(即除了INTO
子句所有的),正如之前描述的,计划以同样的方式缓存。这对SELECT
、带有RETURNING
的INSERT
/UPDATE
/DELETE
以及返回行集的某些工具命令(例如EXPLAIN
)。除了INTO
子句,SQL 命令和它在PL/pgSQL之外的写法一样。
注意带INTO
的SELECT
的这种解释和PostgreSQL常规的SELECT INTO
命令有很大的不同,后者的INTO
目标是一个新创建的表。如果你想要在一个PL/pgSQL函数中从一个SELECT
的结果创建一个表,请使用语法CREATE TABLE ... AS SELECT
。
如果一个行变量或一个变量列表被用作目标,该命令的结果列必须完全匹配该结果的结构,包括数量和数据类型,否则会发生一个运行时错误。当一个记录变量是目标时,它会自动地把自身配置成命令的结果列组成的行类型。
INTO
子句几乎可以出现在 SQL 命令中的任何位置。通常它被写成刚好在SELECT
命令中的select_expressions
列表之前或之后,或者在其他命令类型的命令最后。我们推荐你遵循这种惯例,以防PL/pgSQL的解析器在未来的版本中变得更严格。
如果STRICT
没有在INTO
子句中被指定,那么target
将被设置为该命令返回的第一个行,或者在该命令不返回行时设置为空(注意除非使用了ORDER BY
,否则“第一行”的界定并不清楚)。第一行之后的任何结果行都会被抛弃。你可以检查特殊的FOUND
变量(见第 43.5.5 节)来确定是否返回了一行:
SELECT * INTO myrec FROM emp WHERE empname = myname; IF NOT FOUND THEN RAISE EXCEPTION 'employee % not found', myname; END IF;
如果指定了STRICT
选项,该命令必须刚好返回一行或者将会报告一个运行时错误,该错误可能是NO_DATA_FOUND
(没有行)或TOO_MANY_ROWS
(多于一行)。如果你希望捕捉该错误,可以使用一个异常块,例如:
BEGIN SELECT * INTO STRICT myrec FROM emp WHERE empname = myname; EXCEPTION WHEN NO_DATA_FOUND THEN RAISE EXCEPTION 'employee % not found', myname; WHEN TOO_MANY_ROWS THEN RAISE EXCEPTION 'employee % not unique', myname; END;
成功执行一个带STRICT
的命令总是会将FOUND
置为真。
对于带有RETURNING
的INSERT
/UPDATE
/DELETE
,即使没有指定STRICT
,PL/pgSQL也会针对多于一个返回行的情况报告一个错误。这是因为没有类似于ORDER BY
的选项可以用来决定应该返回哪个被影响的行。
如果为该函数启用了If print_strict_params
,那么当因为
STRICT
的要求没有被满足而抛出一个错误时,该错误消息
的DETAIL
将包括传递给该命令的参数信息。可以通过设置
plpgsql.print_strict_params
为所有函数更改
print_strict_params
设置,但是只有修改后被编译的函数
才会生效。也可以使用一个编译器选项来为一个函数启用它,例如:
CREATE FUNCTION get_userid(username text) RETURNS int AS $$ #print_strict_params on DECLARE userid int; BEGIN SELECT users.userid INTO STRICT userid FROM users WHERE users.username = get_userid.username; RETURN userid; END; $$ LANGUAGE plpgsql;
失败时,这个函数会产生一个这样的错误消息
ERROR: query returned no rows DETAIL: parameters: $1 = 'nosuchuser' CONTEXT: PL/pgSQL function get_userid(text) line 6 at SQL statement
STRICT
选项匹配 Oracle PL/SQL 的SELECT INTO
和相关语句的行为。
很多时候你将想要在PL/pgSQL函数中产生动态命令,也就是每次执行中会涉及到不同表或不同数据类型的命令。PL/pgSQL通常对于命令所做的缓存计划尝试(如第 43.11.2 节中讨论)在这种情境下无法工作。要处理这一类问题,需要提供EXECUTE
语句:
EXECUTEcommand-string
[ INTO [STRICT]target
] [ USINGexpression
[, ... ] ];
其中command-string
是一个能得到一个包含要被执行命令字符串(类型text
)的表达式。可选的target
是一个记录变量、一个行变量或者一个逗号分隔的简单变量以及记录/行域的列表,该命令的结果将存储在其中。可选的USING
表达式提供要被插入到该命令中的值。
在计算得到的命令字符串中,不会做PL/pgSQL变量的替换。任何所需的变量值必须在命令字符串被构造时被插入其中,或者你可以使用下面描述的参数。
还有,对于通过EXECUTE
执行的命令不会有计划被缓存。该命令反而在每次运行时都会被做计划。因此,该命令字符串可以在执行不同表和列上动作的函数中被动态创建。
INTO
子句指定一个返回行的 SQL 命令的结果应该被赋值到哪里。如果提供了一个行或变量列表,它必须完全匹配查询命令结果的结构(当一个记录变量被提供时,它会自动把它自己配置为匹配结果结构)。如果返回多个行,只有第一个行会被赋值给INTO
变量。如果没有返回行,NULL 会被赋值给INTO
变量。如果没有指定INTO
变量,该查询结果会被抛弃。
如果给出了STRICT
选项,除非该查询刚好产生一行,否则将会报告一个错误。
命令字符串可以使用参数值,它们在命令中用$1
、$2
等引用。这些符号引用在USING
子句中提供的值。这种方法常常更适合于把数据值作为文本插入到命令字符串中:它避免了将该值转换为文本以及转换回来的运行时负荷,并且它更不容易被 SQL 注入攻击,因为不需要引用或转义。一个例子是:
EXECUTE 'SELECT count(*) FROM mytable WHERE inserted_by = $1 AND inserted <= $2' INTO c USING checked_user, checked_date;
需要注意的是,参数符号只能用于数据值 — 如果想要使用动态决定的表名或列名,你必须将它们以文本形式插入到命令字符串中。例如,如果前面的那个查询需要在一个动态选择的表上执行,你可以这么做:
EXECUTE 'SELECT count(*) FROM ' || quote_ident(tabname) || ' WHERE inserted_by = $1 AND inserted <= $2' INTO c USING checked_user, checked_date;
一种更干净的方法是使用format()
的
%I
规范,插入自带引号的表名或者列名:
EXECUTE format('SELECT count(*) FROM %I ' 'WHERE inserted_by = $1 AND inserted <= $2', tabname) INTO c USING checked_user, checked_date;
(此示例依赖于隐式连接由换行符分隔的字符串文字的 SQL 规则)
另一个关于参数符号的限制是,它们只能在可优化的命令SELECT
、INSERT
、UPDATE
和DELETE
中有效。在另一种语句类型(通常被称为实用语句)中,即使值是数据值,你也必须将它们以文本形式插入。
在上面第一个例子中,带有一个简单的常量命令字符串和一些USING
参数的EXECUTE
命令在功能上等效于直接用PL/pgSQL写的命令,并且允许自动发生PL/pgSQL变量替换。重要的不同之处在于,EXECUTE
会在每一次执行时根据当前的参数值重新规划该命令,而PL/pgSQL则是创建一个通用计划并且将其缓存以便重用。在最佳计划强依赖于参数值的情况中,使用EXECUTE
来明确地保证不会选择一个通用计划是很有帮助的。
EXECUTE
目前不支持SELECT INTO
。但是可以执行一个纯的SELECT
命令并且指定INTO
作为EXECUTE
本身的一部分。
PL/pgSQL中的EXECUTE
语句与EXECUTE
PostgreSQL服务器支持的 SQL 语句无关。服务器的EXECUTE
语句不能直接在PL/pgSQL函数中使用(并且也没有必要)。
例 43.1. 在动态查询中引用值
在使用动态命令时经常不得不处理单引号的转义。我们推荐在函数体中使用美元符号引用来引用固定的文本(如果你有没有使用美元符界定的老代码,请参考第 43.12.1 节中的概述,这样在把上述代码转换成更合理的模式时会省力些)。
动态值需要被小心地处理,因为它们可能包含引号字符。一个使用
format()
的例子(这假设你用美元符号引用了函数
体,因此引号不需要被双写):
EXECUTE format('UPDATE tbl SET %I = $1 ' 'WHERE key = $2', colname) USING newvalue, keyvalue;
还可以直接调用引用函数:
EXECUTE 'UPDATE tbl SET ' || quote_ident(colname) || ' = ' || quote_literal(newvalue) || ' WHERE key = ' || quote_literal(keyvalue);
这个例子展示了quote_ident
和quote_literal
函数的使用(见第 9.4 节)。为了安全,在进行一个动态查询中的插入之前,包含列或表标识符的表达式应该通过quote_ident
被传递。如果表达式包含在被构造出的命令中应该是字符串的值时,它应该通过quote_literal
被传递。这些函数采取适当的步骤来分别返回被封闭在双引号或单引号中的文本,其中任何嵌入的特殊字符都会被正确地转义。
因为quote_literal
被标记为STRICT
,当用一个空参数调用时,它总是会返回空。在上面的例子中,如果newvalue
或keyvalue
为空,整个动态查询字符串会变成空,导致从EXECUTE
得到一个错误。可以通过使用quote_nullable
函数来避免这种问题,它工作起来和quote_literal
相同,除了用空参数调用时会返回一个字符串NULL
。例如:
EXECUTE 'UPDATE tbl SET ' || quote_ident(colname) || ' = ' || quote_nullable(newvalue) || ' WHERE key = ' || quote_nullable(keyvalue);
如果正在处理的参数值可能为空,那么通常应该用quote_nullable
来代替quote_literal
。
通常,必须小心地确保查询中的空值不会递送意料之外的结果。例如如果keyvalue
为空,下面的WHERE
子句
'WHERE key = ' || quote_nullable(keyvalue)
永远不会成功,因为在=
操作符中使用空操作数得到的结果总是为空。如果想让空和一个普通键值一样工作,你应该将上面的命令重写成
'WHERE key IS NOT DISTINCT FROM ' || quote_nullable(keyvalue)
(目前,IS NOT DISTINCT FROM
的处理效率不如=
,因此只有在非常必要时才这样做。关于空和IS DISTINCT
的详细信息请见第 9.2 节)。
请注意美元符号引用只对引用固定文本有用。尝试写出下面这个例子是一个非常糟糕的主意:
EXECUTE 'UPDATE tbl SET ' || quote_ident(colname) || ' = $$' || newvalue || '$$ WHERE key = ' || quote_literal(keyvalue);
因为如果newvalue
的内容碰巧含有$$
,那么这段代码就会出问题。同样的缺点可能适用于你选择的任何其他美元符号引用定界符。因此,要想安全地引用事先不知道的文本,必须恰当地使用quote_literal
、quote_nullable
或quote_ident
。
动态 SQL 语句也可以使用format
(见第 9.4.1 节)函数来安全地构造。例如:
EXECUTE format('UPDATE tbl SET %I = %L ' 'WHERE key = %L', colname, newvalue, keyvalue);
%I
等效于quote_ident
并且
%L
等效于quote_nullable
。
format
函数可以和
USING
子句一起使用:
EXECUTE format('UPDATE tbl SET %I = $1 WHERE key = $2', colname) USING newvalue, keyvalue;
这种形式更好,因为变量被以它们天然的数据类型格式处理,而不是无
条件地把它们转换成文本并且通过%L
引用它们。这也效率
更高。
动态命令和EXECUTE
的一个更大的例子可以在例 43.10中找到,它会构建并且执行一个CREATE FUNCTION
命令来定义一个新的函数。
有好几种方法可以判断一条命令的效果。第一种方法是使用GET DIAGNOSTICS
命令,其形式如下:
GET [ CURRENT ] DIAGNOSTICSvariable
{ = | := }item
[ , ... ];
这条命令允许检索系统状态指示符。CURRENT
是一个噪声词(另见第 43.6.8.1 节中的GET STACKED DIAGNOSTICS
)。每个item
是一个关键字, 它标识一个要被赋予给指定变量
的状态值(变量应具有正确的数据类型来接收状态值)。表 43.1中展示了当前可用的状态项。冒号等号(:=
)可以被用来取代 SQL 标准的=
符号。例如:
GET DIAGNOSTICS integer_var = ROW_COUNT;
表 43.1. 可用的诊断项
名称 | 类型 | 描述 |
---|---|---|
ROW_COUNT | bigint | 最近的SQL命令处理的行数 |
PG_CONTEXT | text | 描述当前调用栈的文本行(见第 43.6.9 节) |
第二种判断命令效果的方法是检查一个名为FOUND
的boolean
类型的特殊变量。在每一次PL/pgSQL函数调用时,FOUND
开始都为假。它的值会被下面的每一种类型的语句设置:
如果一个SELECT INTO
语句赋值了一行,它将把FOUND
设置为真,如果没有返回行则将之设置为假。
如果一个PERFORM
语句生成(并且抛弃)一行或多行,它将把FOUND
设置为真,如果没有产生行则将之设置为假。
如果UPDATE
、INSERT
以及DELETE
语句影响了至少一行,它们会把FOUND
设置为真,如果没有影响行则将之设置为假。
如果一个FETCH
语句返回了一行,它将把FOUND
设置为真,如果没有返回行则将之设置为假。
如果一个MOVE
语句成功地重定位了游标,它将会把FOUND
设置为真,否则设置为假。
如果一个FOR
或FOREACH
语句迭代了一次或多次,它将会把FOUND
设置为真,否则设置为假。当循环退出时,FOUND
用这种方式设置;在循环执行中,尽管FOUND
可能被循环体中的其他语句的执行所改变,但它不会被循环语句修改。
如果查询返回至少一行,RETURN QUERY
和RETURN QUERY EXECUTE
语句会把FOUND
设为真, 如果没有返回行则设置为假。
其他的PL/pgSQL语句不会改变FOUND
的状态。尤其需要注意的一点是:EXECUTE
会修改GET DIAGNOSTICS
的输出,但不会修改FOUND
的输出。
FOUND
是每个PL/pgSQL函数的局部变量;任何对它的修改只影响当前的函数。
有时一个什么也不做的占位语句也很有用。例如,它能够指示 if/then/else 链中故意留出的空分支。可以使用NULL
语句达到这个目的:
NULL;
例如,下面的两段代码是等价的:
BEGIN y := x / 0; EXCEPTION WHEN division_by_zero THEN NULL; -- 忽略错误 END;
BEGIN y := x / 0; EXCEPTION WHEN division_by_zero THEN -- 忽略错误 END;
究竟使用哪一种取决于各人的喜好。
在 Oracle 的 PL/SQL 中,不允许出现空语句列表,并且因此在这种情况下必须使用NULL
语句。而PL/pgSQL允许你什么也不写。