事务的实现
---------------
一个事务从开始到结束通常会经历以下三个阶段:
1. 事务开始。
2. 命令入队。
3. 事务执行。
本节接下来的内容将对这三个阶段进行介绍,
说明一个事务从开始到结束的整个过程。
事务开始
^^^^^^^^^^
:ref:`MULTI` 命令的执行标志着事务的开始:
::
redis> MULTI
OK
:ref:`MULTI` 命令可以将执行该命令的客户端从非事务状态切换至事务状态,
这一切换是通过在客户端状态的 ``flags`` 属性中打开 ``REDIS_MULTI`` 标识来完成的,
:ref:`MULTI` 命令的实现可以用以下伪代码来表示:
.. code-block:: python
def MULTI():
# 打开事务标识
client.flags |= REDIS_MULTI
# 返回 OK 回复
replyOK()
.. ||
命令入队
^^^^^^^^^^^^^
当一个客户端处于非事务状态时,
这个客户端发送的命令会立即被服务器执行:
::
redis> SET "name" "Practical Common Lisp"
OK
redis> GET "name"
"Practical Common Lisp"
redis> SET "author" "Peter Seibel"
OK
redis> GET "author"
"Peter Seibel"
与此不同的是,
当一个客户端切换到事务状态之后,
服务器会根据这个客户端发来的不同命令执行不同的操作:
- 如果客户端发送的命令为 :ref:`EXEC` 、 :ref:`DISCARD` 、 :ref:`WATCH` 、 :ref:`MULTI` 四个命令的其中一个,
那么服务器立即执行这个命令。
- 与此相反,
如果客户端发送的命令是 :ref:`EXEC` 、 :ref:`DISCARD` 、 :ref:`WATCH` 、 :ref:`MULTI` 四个命令以外的其他命令,
那么服务器并不立即执行这个命令,
而是将这个命令放入一个事务队列里面,
然后向客户端返回 ``QUEUED`` 回复。
服务器判断命令是该入队还是该立即执行的过程可以用流程图 IMAGE_ENQUEUE_OR_EXEC 来描述。
.. graphviz::
digraph enque_or_execute {
label = "\n图 IMAGE_ENQUEUE_OR_EXEC 服务器判断命令是该入队还是该执行的过程";
node [shape = box];
//
command_in [label = "服务器接到来自客户端的命令"];
in_transaction_or_not [label = "这个客户端正处于事务状态?", shape = diamond];
not_exec_and_discard [label = "这个命令是否\nEXEC 、 DISCARD 、\nWATCH 或 MULTI ?", shape = diamond];
enqueu_command [label = "将命令放入事务队列"];
return_enqueued [label = "向客户端返回 QUEUED"];
exec_command [label = "执行这个命令"];
return_command_result [label = "向客户端返回命令的执行结果"];
//
command_in -> in_transaction_or_not;
in_transaction_or_not -> not_exec_and_discard [label = "是"];
not_exec_and_discard -> enqueu_command [label = "否"];
not_exec_and_discard -> exec_command [label = "是"];
in_transaction_or_not -> exec_command [label = "否"];
exec_command -> return_command_result;
enqueu_command -> return_enqueued;
}
..
以下是一些命令入队的例子:
::
redis> SET "name" "Practical Common Lisp"
QUEUED
redis> GET "name"
QUEUED
redis> SET "author" "Peter Seibel"
QUEUED
redis> GET "author"
QUEUED
事务队列
^^^^^^^^^^^^^^^
每个 Redis 客户端都有自己的事务状态,
这个事务状态保存在客户端状态的 ``mstate`` 属性里面:
::
typedef struct redisClient {
// ...
// 事务状态
multiState mstate; /* MULTI/EXEC state */
// ...
} redisClient;
事务状态包含一个事务队列,
以及一个已入队命令的计数器
(也可以说是事务队列的长度):
::
typedef struct multiState {
// 事务队列,FIFO 顺序
multiCmd *commands;
// 已入队命令计数
int count;
} multiState;
事务队列是一个 ``multiCmd`` 类型的数组,
数组中的每个 ``multiCmd`` 结构都保存了一个已入队命令的相关信息,
包括指向命令实现函数的指针,
命令的参数,
以及参数的数量:
::
typedef struct multiCmd {
// 参数
robj **argv;
// 参数数量
int argc;
// 命令指针
struct redisCommand *cmd;
} multiCmd;
事务队列以先进先出(FIFO)的方式保存入队的命令:
较先入队的命令会被放到数组的前面,
而较后入队的命令则会被放到数组的后面。
举个例子,
如果客户端执行以下命令:
::
redis> MULTI
OK
redis> SET "name" "Practical Common Lisp"
QUEUED
redis> GET "name"
QUEUED
redis> SET "author" "Peter Seibel"
QUEUED
redis> GET "author"
QUEUED
那么服务器将为客户端创建图 IMAGE_TRANSACTION_STATE 所示的事务状态:
- 最先入队的 :ref:`SET` 命令被放在了事务队列的索引 ``0`` 位置上。
- 第二入队的 :ref:`GET` 命令被放在了事务队列的索引 ``1`` 位置上。
- 第三入队的另一个 :ref:`SET` 命令被放在了事务队列的索引 ``2`` 位置上。
- 最后入队的另一个 :ref:`GET` 命令被放在了事务队列的索引 ``3`` 位置上。
.. graphviz::
digraph {
label = "\n 图 IMAGE_TRANSACTION_STATE 事务状态";
rankdir = LR;
node [shape = record];
//redisClient [label = "
redisClient | ... | mstate | ... "];
multiState [label = " multiState | commands | count \n 4 "];
commands [label = " multiCmd[4] | <0> [0] | <1> [1] | <2> [2] | <3> [3] "];
multiCmd0 [label = " multiCmd | argv | argc \n 3 | cmd "];
multiCmd1 [label = " multiCmd | argv | argc \n 2 | cmd "];
multiCmd2 [label = " multiCmd | argv | argc \n 3 | cmd "];
multiCmd3 [label = " multiCmd | argv | argc \n 2 | cmd "];
//redisClient:mstate -> multiState:head;
multiState:commands -> commands:head;
commands:0 -> multiCmd0:head;
commands:1 -> multiCmd1:head;
commands:2 -> multiCmd2:head;
commands:3 -> multiCmd3:head;
argv0 [label = " robj*[3] | { StringObject \n \"SET\" | StringObject \n \"name\" | StringObject \n \"Practical Common Lisp\" } "];
cmd0 [label = " setCommand ", shape = plaintext];
multiCmd0:argv -> argv0;
multiCmd0:cmd -> cmd0;
argv1 [label = " robj*[2] | { StringObject \n \"GET\" | StringObject \n \"name\" } "];
cmd1 [label = " getCommand ", shape = plaintext];
multiCmd1:argv -> argv1;
multiCmd1:cmd -> cmd1;
argv2 [label = " robj*[3] | { StringObject \n \"SET\" | StringObject \n \"author\" | StringObject \n \"Peter Seibel\" } "];
cmd2 [label = " setCommand ", shape = plaintext];
multiCmd2:argv -> argv2;
multiCmd2:cmd -> cmd2;
argv3 [label = " robj*[2] | { StringObject \n \"GET\" | StringObject \n \"author\" } "];
cmd3 [label = " getCommand ", shape = plaintext];
multiCmd3:argv -> argv3;
multiCmd3:cmd -> cmd3;
}
执行事务
^^^^^^^^^^^^^
当一个处于事务状态的客户端向服务器发送 :ref:`EXEC` 命令时,
这个 :ref:`EXEC` 命令将立即被服务器执行:
服务器会遍历这个客户端的事务队列,
执行队列中保存的所有命令,
最后将执行命令所得的结果全部返回给客户端。
举个例子,
对于图 IMAGE_TRANSACTION_STATE 所示的事务队列来说,
服务器首先会执行命令:
::
SET "name" "Practical Common Lisp"
接着执行命令:
::
GET "name"
之后执行命令:
::
SET "author" "Peter Seibel"
再之后执行命令:
::
GET "author"
最后,
服务器会将执行这四个命令所得的回复返回给客户端:
::
redis> EXEC
1) OK
2) "Practical Common Lisp"
3) OK
4) "Peter Seibel"
:ref:`EXEC` 命令的实现原理可以用以下伪代码来描述:
.. code-block:: python
def EXEC():
# 创建空白的回复队列
reply_queue = []
# 遍历事务队列中的每个项
# 读取命令的参数,参数的个数,以及要执行的命令
for argv, argc, cmd in client.mstate.commands:
# 执行命令,并取得命令的返回值
reply = execute_command(cmd, argv, argc)
# 将返回值追加到回复队列末尾
reply_queue.append(reply)
# 移除 REDIS_MULTI 标识,让客户端回到非事务状态
client.flags &= ~REDIS_MULTI
# 清空客户端的事务状态,包括:
# 1)清零入队命令计数器
# 2)释放事务队列
client.mstate.count = 0
release_transaction_queue(client.mstate.commands)
# 将事务的执行结果返回给客户端
send_reply_to_client(client, reply_queue)
..
在事务和非事务状态下执行命令
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
无论在事务状态下,
还是在非事务状态下,
Redis 命令都由同一个函数执行,
所以它们共享很多服务器的一般设置,
比如 AOF 的配置、RDB 的配置,以及内存限制,等等。
不过事务中的命令和普通命令在执行上还是有一点区别的,其中最重要的两点是:
1. 非事务状态下的命令以单个命令为单位执行,前一个命令和后一个命令的客户端不一定是同一个;
而事务状态则是以一个事务为单位,执行事务队列中的所有命令:除非当前事务执行完毕,否则服务器不会中断事务,也不会执行其他客户端的其他命令。
2. 在非事务状态下,执行命令所得的结果会立即被返回给客户端;
而事务则是将所有命令的结果集合到回复队列,再作为 :ref:`EXEC` 命令的结果返回给客户端。
..
示例:完整的事务执行过程
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
为了进一步熟悉事务的执行过程,
让我们来看一个完整的事务执行例子。
首先,
假设客户端当前为非事务状态,
那么当它向服务器发送 :ref:`MULTI` 命令之后,
客户端切换为事务状态:
::
redis> MULTI
OK
接下来,
客户端向服务器发送 :ref:`SET` 命令:
::
redis> SET book-name "Mastering C++ in 21 days"
QUEUED
因为客户端正处于事务状态,
并且 :ref:`SET` 命令不是 :ref:`EXEC` 、 :ref:`DISCARD` 、 :ref:`WATCH` 或 :ref:`MULTI` 命令的其中一个,
所以这个命令不会被直接执行,
而是被保存到事务队列里面。
表 TABLE_FIRST_STEP 记录了 :ref:`SET` 命令入队之后,
事务队列的状态。
----
表 TABLE_FIRST_STEP :ref:`SET` 命令入队之后的事务队列
========= =============== =========================================================== ==================
数组索引 cmd argv argc
========= =============== =========================================================== ==================
``0`` ``SET`` ``["book-name", "Mastering C++ in 21 days"]`` ``2``
========= =============== =========================================================== ==================
----
因为 :ref:`SET` 命令是第一个入队的命令,
所以它会放在事务队列的索引 ``0`` 上面。
接下来,
客户端继续向服务器发送 :ref:`GET` 命令:
::
redis> GET book-name
QUEUED
和前面的 :ref:`SET` 命令类似,
这个 :ref:`GET` 命令也不会被立即执行,
而是被放到事务队列的索引 ``1`` 上面。
表 TABLE_SECOND_STEP 记录了 :ref:`GET` 命令入队之后,
事务队列的状态。
----
表 TABLE_SECOND_STEP :ref:`GET` 命令入队之后的事务队列
========= =============== =========================================================== ==================
数组索引 cmd argv argc
========= =============== =========================================================== ==================
``0`` ``SET`` ``["book-name", "Mastering C++ in 21 days"]`` ``2``
``1`` ``GET`` ``["book-name"]`` ``1``
========= =============== =========================================================== ==================
----
之后,
客户端继续发送 :ref:`SADD` 命令和 :ref:`SMEMBERS` 命令,
这两个命令将分别入队到事务队列的索引 ``2`` 和索引 ``3`` 里面:
::
redis> SADD tag "C++" "Programming" "Mastering Series"
QUEUED
redis> SMEMBERS tag
QUEUED
表 TABLE_THREETH_STEP 记录了 :ref:`SADD` 和 :ref:`SMEMBERS` 命令入队之后,
事务队列的状态。
----
表 TABLE_THREETH_STEP :ref:`SADD` 和 :ref:`SMEMBERS` 命令入队之后的事务队列
.. include:: _example_of_transaction_queue.include
----
最后,
客户端向服务器发送 :ref:`EXEC` 命令,
这个命令会立即执行,
触发事务队列中的所有命令被执行:
- 首先被执行的是事务队列中索引为 ``0`` 的 :ref:`SET` 命令,
这个命令产生一个 status reply ``OK`` 。
- 第二被执行的是事务队列中索引为 ``1`` 的 :ref:`GET` 命令,
这个命令产生一个 bulk reply ``"Mastering C++ in 21 days"`` 。
- 第三个被执行的是事务队列中索引为 ``2`` 的 :ref:`SADD` 命令,
这个命令产生一个 integer reply ``(integer) 3`` 。
- 最后一个被执行的是事务队列中索引为 ``3`` 的 :ref:`SMEMBERS` 命令,
这个命令产生一个 multi bulk reply ,
回复的三个元素分别是 ``"Mastering Series"`` 、 ``"C++"`` 和 ``"Programming"`` 。
这些事务命令的回复首先被服务器放到一个回复队列里面,
之后再作为 :ref:`EXEC` 命令的结果发送给客户端:
::
redis> EXEC
1) OK
2) "Mastering C++ in 21 days"
3) (integer) 3
4) 1) "Mastering Series"
2) "C++"
3) "Programming"
至此,
事务执行完毕。
事务状态下的 DISCARD 、 WATCH 和 MULTI 命令
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
除了 :ref:`EXEC` 命令以外,
服务器在客户端处于事务状态时,
不加入到事务队列而直接执行的另外三个命令是 :ref:`DISCARD` 、 :ref:`WATCH` 和 :ref:`MULTI` 。
:ref:`DISCARD` 命令用于中途取消一个事务,
当这个命令执行时,
服务器清空客户端的事务队列,
并将客户端从事务状态转换回非事务状态,
最后向客户端返回 ``OK`` ,
表示事务已被取消:
::
redis redis> MULTI
OK
redis redis> SET book-name "Mastering C++ in 21 days"
QUEUED
redis redis> GET book-name
QUEUED
redis redis> DISCARD
OK
:ref:`WATCH` 命令用于监视给定的键,
它只能在客户端进入事务状态之前执行,
客户端在事务状态下发送 :ref:`WATCH` 命令将引发一个错误,
但这个错误不会对客户端状态以及事务队列产生任何影响,
命令可以继续入队,
事务也可以正常执行:
::
redis redis> MULTI
OK
redis redis> SET book-name "Mastering C++ in 21 days"
QUEUED
redis redis> WATCH book-name
(error) ERR WATCH inside MULTI is not allowed
redis redis> GET book-name
QUEUED
redis redis> EXEC
1) OK
2) "Mastering C++ in 21 days"
Redis 的事务是不可嵌套的,
已经处于事务状态的客户端向服务器再次发送 :ref:`MULTI` 命令将引发一个错误,
但这个错误不会对客户端状态以及事务队列产生任何影响,
命令可以继续入队,
事务也可以正常执行
(和处理 :ref:`WATCH` 命令的方法相同):
::
redis redis> MULTI
OK
redis redis> SET book-name "Mastering C++ in 21 days"
QUEUED
redis redis> MULTI
(error) ERR MULTI calls can not be nested
redis redis> GET book-name
QUEUED
redis redis> EXEC
1) OK
2) "Mastering C++ in 21 days"