分享到

什么是 PostgreSQL 列和表约束?

约束是在 数据类型提供的要求之外,对可接受值的附加要求。它们允许您为数据定义比通用数据类型更窄的条件。

这些通常反映了基于您的应用程序提供的附加上下文的字段的特定特征。例如,age 字段可能使用 int 数据类型来存储整数。但是,某些范围的可接受整数作为有效年龄是没有意义的。例如,负整数在这种情况下是不合理的。我们可以使用约束在 PostgreSQL 中表达这种逻辑要求。

约束的定义位置:列约束与表约束

PostgreSQL 允许您创建与特定列或整个表关联的约束。

几乎所有约束都可以以这两种形式使用,无需修改

约束
CHECK
NOT NULL*
UNIQUE
PRIMARY KEY
FOREIGN KEY

*NOT NULL 不能用作表约束。但是,您可以通过在 CHECK 表约束中使用 IS NOT NULL 作为语句来近似获得结果。

让我们看看列约束和表约束有何不同。

列约束

列约束是附加到单个的约束。它们用于确定建议的列值是否有效。在根据基本类型要求(例如确保值对于 int 列是整数)验证输入后,将评估列约束。

列约束非常适合表达仅限于单个字段的要求。它们将约束条件直接附加到相关的列。例如,我们可以在 person 表中对 age 限制进行建模,方法是在列名和数据类型后添加约束

CREATE TABLE person (
. . .
age int CHECK (age >= 0),
. . .
);

此代码片段定义了一个 person 表,其中一列是名为 ageintage 必须大于或等于零。列约束很容易理解,因为它们作为附加要求添加到它们影响的列上。

表约束

另一种约束称为表约束。表约束可以表达列约束可以表达的任何限制,但也可以额外表达涉及多个列的限制。表约束不是附加到特定列,而是定义为表的单独组件,并且可以引用表的任何列。

我们之前看到的列约束可以像这样表示为表约束

CREATE TABLE person (
. . .
age int,
. . .
CHECK (age >= 0)
);

使用相同的基本语法,但约束是单独列出的。为了利用表约束引入复合限制的能力,我们可以使用逻辑 AND 运算符来连接来自不同列的多个条件。

例如,在银行数据库中,名为 qualified_borrowers 的表可能需要检查个人是否拥有现有账户以及提供抵押品的能力,以便获得贷款资格。将这两者都包含在同一检查中可能是有意义的

CREATE TABLE qualified_borrowers (
. . .
account_number int,
acceptable_collateral boolean,
. . .
CHECK (account_number IS NOT NULL AND acceptable_collateral = 't')
);

在这里,我们再次使用 CHECK 约束来检查 account_number 是否为空,以及贷款专员是否通过检查 acceptable_collateral 列将客户标记为拥有可接受的抵押品。由于正在检查多个列,因此表约束是必要的。

现在是提及的好时机,尽管在这些示例中,我们将主要使用 CREATE TABLE SQL 命令来创建新表,但您也可以使用 ALTER TABLE 向现有表添加约束。当使用 ALTER TABLE 时,默认情况下,新约束会导致表中当前的值根据新约束进行检查。您可以通过包含 NOT VALID 子句来跳过此行为。

为约束创建名称

默认约束名称

当您使用上述语法创建约束时,PostgreSQL 会自动选择一个合理的但模糊的名称。在上面的 qualified_borrowers 表的示例中,PostgreSQL 会将约束命名为 qualified_borrowers_check

INSERT INTO qualified_borrowers VALUES (123, false);
ERROR: new row for relation "qualified_borrowers" violates check constraint "qualified_borrowers_check"
DETAIL: Failing row contains (123, f).

当约束被违反时,此名称为您提供有关表和约束类型的信息。但是,如果表上存在多个约束,则更具描述性的名称有助于进行故障排除。

自定义约束名称

您可以通过在约束定义前面加上 CONSTRAINT 关键字和名称来选择性地指定约束的名称。

添加自定义名称的基本语法如下

CONSTRAINT <constraint_name> <constraint_type_and_details>

例如,如果您想将 qualified_borrowers 表中的约束命名为 loan_worthiness,您可以改为像这样定义表

CREATE TABLE qualified_borrowers (
. . .
account_number int,
acceptable_collateral boolean,
. . .
CONSTRAINT loan_worthiness CHECK (account_number IS NOT NULL AND acceptable_collateral = 't')
);

现在,当我们违反约束时,我们会得到更具描述性的标签

INSERT INTO qualified_borrowers VALUES (123, false);
ERROR: new row for relation "qualified_borrowers" violates check constraint "loan_worthiness"
DETAIL: Failing row contains (123, f).

您可以以相同的方式命名列约束

CREATE TABLE teenagers (
. . .
age int CONSTRAINT is_teenager CHECK (age >= 13 AND age <= 19),
. . .
);

PostgreSQL 的可用约束列表

现在我们已经介绍了一些约束如何工作的基本知识,我们可以更深入地了解可用的约束以及如何使用它们。

检查约束

检查约束是一种通用约束,允许您指定一个涉及列或表值的表达式,该表达式的计算结果为布尔值。

您之前已经看过一些检查约束的示例。检查约束以关键字 CHECK 开头,然后提供一个用括号括起来的表达式。对于列约束,这放在数据类型声明之后。对于表约束,这些可以放在与它们交互的列定义之后的任何位置。

例如,我们可以创建一个 film_nominations 表,其中包含已获得提名并有资格获得 2019 年长片奖的电影

CREATE TABLE film_nominations (
title text,
director varchar(250),
release_date date CHECK ('01-01-2019' <= release_date AND release_date <= '12-31-2019'),
length int,
votes int,
CHECK (votes >= 10 AND length >= 40)
);

我们有一个列检查约束,用于检查 release_date 是否在 2019 年内。之后,我们有一个表检查约束,确保影片已收到足够的票数以获得提名,并且片长符合“长片”类别的资格。

在评估检查约束时,可接受的值返回 true。如果新记录的值满足所有类型要求和约束,则该记录将添加到表中

INSERT INTO film_nominations VALUES (
'A great film',
'Talented director',
'07-16-2019',
117,
45
);
INSERT 0 1

产生 false 的值会产生错误,指示约束未满足

INSERT INTO film_nominations VALUES (
'A poor film',
'Misguided director',
'10-24-2019',
128,
1
);
ERROR: new row for relation "film_nominations" violates check constraint "film_nominations_check"
DETAIL: Failing row contains (A poor film, Misguided director, 2019-07-16, 128, 1).

在这种情况下,影片满足了除所需票数以外的所有条件。PostgreSQL 拒绝提交,因为它未通过最终的表检查约束。

非空约束

NOT NULL 约束更加专注。它保证列中的值不为空。虽然这是一个简单的约束,但它使用非常频繁。

如何在 PostgreSQL 中添加非空约束

要将列标记为需要非空值,请在类型声明后添加 NOT NULL

CREATE TABLE national_capitals (
country text NOT NULL,
capital text NOT NULL,
);

在上面的示例中,我们有一个简单的两列表,将国家/地区映射到其首都。由于这两者都是必需字段,留空没有意义,因此我们添加了 NOT NULL 约束。

现在插入空值会导致错误

INSERT INTO national_capitals VALUES (
NULL,
'London',
);
ERROR: null value in column "country" violates not-null constraint
DETAIL: Failing row contains (null, London).

NOT NULL 约束仅作为列约束起作用(它不能用作表约束)。但是,您可以通过在表 CHECK 约束中使用 IS NOT NULL 轻松解决此问题。

例如,这提供了使用表约束的等效保证

CREATE TABLE national_capitals (
country text,
capital text,
CHECK (country IS NOT NULL AND capital IS NOT NULL)
);

唯一约束

UNIQUE 约束告诉 PostgreSQL,列中的每个值都不能重复。这在许多不同的场景中都很有用,在多个记录中具有相同的值应该是不可能的。

例如,处理任何类型的 ID 的列,根据定义,应该具有唯一值。社会安全号码、学生或客户 ID 或产品 UPC(条形码编号)如果无法区分特定人员或商品,将毫无用处。

UNIQUE 约束可以在列级别指定

CREATE TABLE supplies (
supply_id integer UNIQUE,
name text,
inventory integer
);

它们也可以指定为表约束

CREATE TABLE supplies (
supply_id integer,
name text,
inventory integer,
UNIQUE (supply_id)
);

使用 UNIQUE 表约束的优势之一是,它允许您对列的组合执行唯一性检查。这通过指定 PostgreSQL 应该一起评估的两个或多个列来实现。单个列中的值可能会重复,但指定的值组合必须是唯一的。

例如,让我们回顾一下我们之前使用的 national_capitals

CREATE TABLE national_capitals (
country text NOT NULL,
capital text NOT NULL,
);

如果我们想确保我们不会为同一对添加多个记录,我们可以在此处向列添加 UNIQUE 约束

CREATE TABLE national_capitals (
country text NOT NULL UNIQUE,
capital text NOT NULL UNIQUE,
);

这将确保国家和首都都仅在每个表中出现一次。但是,一些国家有多个首都。这意味着我们可能有多个条目具有相同的 country 值。这些不适用于当前设计

INSERT INTO national_capitals VALUES (
'Bolivia',
'Sucre'
);
INSERT INTO national_capitals VALUES (
'Bolivia',
'La Paz'
);
INSERT 0 1
ERROR: duplicate key value violates unique constraint "national_capitals_country_key"
DETAIL: Key (country)=(Bolivia) already exists.

如果我们仍然想确保我们不会最终得到重复的条目,同时允许单个列中存在重复值,那么对 countrycapital 组合进行唯一性检查就足够了

CREATE TABLE national_capitals (
country text,
capital text,
UNIQUE (country, capital)
);

现在,我们可以将玻利维亚的两个首都都添加到表中,而不会出错

INSERT INTO national_capitals VALUES (
'Bolivia',
'Sucre'
);
INSERT INTO national_capitals VALUES (
'Bolivia',
'La Paz'
);
INSERT 0 1
INSERT 0 1

但是,尝试两次添加相同的组合仍然会被约束捕获

INSERT INTO national_capitals VALUES (
'Bolivia',
'Sucre'
);
INSERT INTO national_capitals VALUES (
'Bolivia',
'Sucre'
);
INSERT 0 1
ERROR: duplicate key value violates unique constraint "national_capitals_country_capital_key"
DETAIL: Key (country, capital)=(Bolivia, Sucre) already exists.

主键约束

PRIMARY KEY 约束具有特殊用途。它指示该列可用于唯一标识表中的记录。这意味着它必须是可靠的唯一的,并且每个记录在该列中都必须有一个值。

建议每个表都使用主键,但不是必需的,并且每个表只能有一个主键。主键主要用于标识、检索、修改或删除表中的单个记录。它们允许用户和管理员使用由 PostgreSQL 保证与恰好一个记录匹配的标识符来定位操作。

让我们使用我们之前看到的 supplies 表作为示例

CREATE TABLE supplies (
supply_id integer UNIQUE,
name text,
inventory integer
);

在这里,我们确定 supply_id 应该是唯一的。如果我们想使用此列作为我们的主键(保证唯一性和非空值),我们可以简单地将 UNIQUE 约束更改为 PRIMARY KEY

CREATE TABLE supplies (
supply_id integer PRIMARY KEY,
name text,
inventory integer
);

这样,如果我们需要更新特定供应品的库存量,我们可以使用主键来定位它

INSERT INTO supplies VALUES (
38,
'nails',
5
);
UPDATE supplies set inventory = 10 WHERE supply_id = 38;
INSERT 0 1
UPDATE 1

虽然许多表使用单个列作为主键,但也可以使用一组列作为表约束来创建主键。

national_capitals 表是演示这一点的理想选择。如果我们想使用现有列创建主键,我们可以将 UNIQUE 表约束替换为 PRIMARY KEY

CREATE TABLE national_capitals (
country text,
captial text,
PRIMARY KEY (country, capital)
);

外键约束

外键是一个表中的列,它引用另一个表中的列值。这在各种场景中是理想的且通常是必要的,在这些场景中,表包含相关数据。数据库轻松连接和引用存储在单独表中的数据的能力是关系数据库的主要功能之一。

例如,您可能有一个 orders 表来跟踪单个订单,以及一个 customers 表来跟踪联系信息和有关客户的信息。将此信息分开存放是有意义的,因为客户可能有多个订单。但是,能够轻松链接这两个表中的记录以允许更复杂的操作也是有意义的。

如何在 PostgreSQL 中创建外键约束

让我们从尝试对 customers 表建模开始

CREATE TABLE customers (
customer_id serial PRIMARY KEY,
first_name text,
last_name text,
phone_number bigint,
);

此表非常简单。它包含用于存储家长的名字、姓氏和电话号码的列。它还指定了一个使用 PRIMARY KEY 约束的 ID 列。如果未指定 ID,则 serial 数据类型用于自动生成序列中的下一个 ID。

对于 orders 表,我们希望能够指定有关单个订单的信息。一个重要的数据是哪个客户下了订单。我们可以使用外键将订单链接到客户,而无需复制信息。我们使用 REFERENCES 约束来执行此操作,该约束定义了与另一个表中的列的外键关系

CREATE TABLE orders (
order_id serial PRIMARY KEY,
order_date date,
customer integer REFERENCES customers
);

在这里,我们指示 orders 表中的 customer 列与 customers 表具有外键关系。由于我们未指定 customers 表中的特定列,因此 PostgreSQL 假定我们要链接到 customers 表中的主键:customer_id

如果我们尝试在 orders 表中插入一个不引用有效客户的值,PostgreSQL 将拒绝它

INSERT INTO orders VALUES (
100,
'11-19-2019',
300
);
ERROR: insert or update on table "orders" violates foreign key constraint "orders_customer_fkey"
DETAIL: Key (customer)=(300) is not present in table "customers".

如果我们先添加客户,我们的订单将被系统接受

INSERT INTO customers VALUES (
300,
'Jill',
'Smith',
'5551235677'
);
INSERT INTO orders VALUES (
100,
'11-19-2019',
300
);
INSERT 0 1
INSERT 0 1

虽然主键是外键的理想选择,因为它保证只匹配一个记录,但您也可以使用其他列,只要它们是唯一的。为此,您只需在 REFERENCES 定义中的表名后用括号指定列

CREATE TABLE example (
. . .
column type REFERENCES other_table (column)
);

您还可以使用保证唯一的一组列。为此,您需要使用以 FOREIGN KEY 开头的表约束,并引用您在表描述中较早定义的列

CREATE TABLE example (
. . .
FOREIGN KEY (column1, column2) REFERENCES other_table (column1, column2)
);

决定在删除或更新时如何处理外键

定义外键约束时,您需要考虑的一个问题是,当引用的表被删除或更新时该怎么办。

例如,让我们再次看一下 customersorders 表。我们需要指定当我们从 customers 表中删除客户时,如果该客户在 orders 表中有关联的订单,我们希望系统如何响应。

我们可以从以下选项中选择

  • RESTRICT(限制):选择限制删除意味着如果 customer 记录被 orders 表中的记录引用,PostgreSQL 将拒绝删除该记录。要删除一个客户,您必须首先从 orders 表中删除任何关联的记录。只有这样,您才能从 customer 表中删除该值。
  • CASCADE(级联):选择级联选项意味着当我们删除 customer 记录时,orders 表中引用它的记录也被删除。这在许多情况下很有用,但必须谨慎使用,以避免错误地删除数据。
  • NO ACTION(无操作):无操作选项告诉 PostgreSQL 简单地删除客户,而不对关联的 orders 记录执行任何操作。如果稍后检查约束,它仍然会引起错误,但这不会在初始删除期间发生。如果没有指定其他操作,这是默认操作。
  • SET NULL(设置为空):此选项告诉 PostgreSQL 在删除被引用记录时,将被引用列设置为 null。因此,如果我们从 customers 表中删除一个客户,orders 表中的 customer 列将被设置为 NULL
  • SET DEFAULT(设置为默认值):如果选择此选项,PostgreSQL 将在删除被引用记录时,将被引用列更改为默认值。因此,如果 orders 表中的 customer 列具有默认值,并且我们从 customers 表中删除一个客户,则 orders 值中的记录将被分配默认值。

这些操作可以在定义外键约束时指定,方法是添加 ON DELETE,后跟操作。因此,如果我们希望在删除客户时从系统中删除关联的订单,我们可以像这样指定它

CREATE TABLE orders (
order_id serial PRIMARY KEY,
order_date date,
customer integer REFERENCES customers ON DELETE CASCADE
);

这些类型的操作也可以在更新被引用列而不是删除列时应用,方法是使用 ON UPDATE 而不是 ON DELETE

排除约束

我们将讨论的最后一种约束类型是排除约束。虽然像 CHECK 这样的约束可以单独检查每行的有效性,但排除约束会相互检查多行的值。UNIQUE 约束是一种特定类型的排除约束,它检查每行的指定列或列组合是否具有不同的值。

例如,您可以使用排除约束来确保两个日期范围之间没有重叠,如下所示:

CREATE EXTENSION btree_gist;
CREATE TABLE bookings (
room int,
booking_start date,
booking_end date,
EXCLUDE USING gist (
room WITH =,
daterange(booking_start, booking_end, '[]') WITH &&
)
);

在这里,我们有一个用于酒店预订的 create table 语句,其中包含房间号以及预订开始和结束日期。首先,指定 CREATE EXTENSION btree_gist 以确保我们即将使用的索引方法在数据库中已启用。之后,我们使用 EXCLUDE USING 语法添加排除约束。我们将 gist 指定为索引方法,这告诉 PostgreSQL 如何索引和访问值以进行比较。

然后,我们列出我们想要比较项目的方式。我们指定 room 值应使用等号进行比较,这意味着约束将仅匹配具有相同 room 的两行。daterangebooking_startbooking_end 列一起作为日期范围进行检查。我们包含 [] 作为可选的第三个参数,以指示范围应以包含方式进行比较。&& 运算符指定日期范围应检查重叠。

因此,总而言之,该约束确保同一房间不会在重叠的日期被预订。

结论

在本教程中,我们学习了如何使用 PostgreSQL 的约束来精确定义表的有效值。我们讨论了列约束和表约束之间的区别。之后,我们介绍了各种类型的约束,并演示了如何使用它们来限制您的表接受的输入类型。

约束是众多功能之一,可帮助您定义数据结构中的期望。一旦您提供了约束,您就可以允许 PostgreSQL 验证任何输入是否符合要求。这是使用 PostgreSQL 数据库系统来强制保证数据保持一致性和有意义性的一种小方法。

关于作者
Justin Ellingwood

Justin Ellingwood

自 2013 年以来,Justin 一直在撰写关于数据库、Linux、基础设施和开发者工具的文章。他目前与妻子和两只兔子住在柏林。他通常不必用第三人称写作,这对所有相关方来说都是一种解脱。