分享到

什么是 PostgreSQL 列约束和表约束?

约束附加的要求,用于限定可接受的值,它是对数据类型所提供要求的补充。它们允许你为数据定义比通用数据类型更窄的条件。

这些通常反映了字段基于你的应用程序提供的附加上下文的具体特征。例如,age 字段可能使用 int 数据类型来存储整数。但是,某些范围的可接受整数作为有效年龄是没有意义的。例如,负整数在此场景中是不合理的。我们可以使用 PostgreSQL 中的约束来表达这种逻辑要求。

约束的定义位置:列约束 vs 表约束

PostgreSQL 允许你创建与特定列关联的约束,或与整个表关联的约束。

几乎所有约束都可以以这两种形式使用,无需修改

约束
CHECK
NOT NULL*
UNIQUE
PRIMARY KEY
FOREIGN KEY

*NOT NULL 不能用作表约束。但是,你可以通过在 CHECK 表约束中使用 IS NOT NULL 作为语句来近似获得结果。

让我们看看列约束和表约束有何不同。

列约束

列约束是附加到单个的约束。它们用于确定列的建议值是否有效。列约束在输入根据基本类型要求(例如,确保 int 列的值是整数)验证后进行评估。

列约束非常适合表达仅限于单个字段的要求。它们将约束条件直接附加到相关的列。例如,我们可以在 person 表中建模 age 限制,方法是在列名和数据类型后添加约束

CREATE TABLE person (
. . .
age int CHECK (age >= 0),
. . .
);

此代码段定义了一个 person 表,其中一列是名为 ageint 类型。 age 必须大于或等于零。列约束易于理解,因为它们作为附加要求添加到它们影响的列上。

表约束

另一种类型的约束称为表约束。表约束可以表达列约束可以表达的任何限制,但还可以表达涉及多个列的限制。表约束不是附加到特定列,而是定义为表的单独组件,并且可以引用表的任何列。

我们之前看到的列约束可以表示为如下表约束

CREATE TABLE person (
. . .
age int,
. . .
CHECK (age >= 0)
);

使用了相同的基本语法,但约束是单独列出的。为了利用表约束引入复合限制的能力,我们可以使用逻辑 AND 运算符来连接来自不同列的多个条件。

例如,在银行数据库中,名为 qualified_borrowers 的表可能需要检查个人是否拥有现有帐户以及提供抵押品的能力,以便获得贷款资格。将这两者都包含在同一检查中可能是有意义的

CREATE TABLE qualified_borrowers (
. . .
account_number int,
acceptable_collateral boolean,
. . .
CHECK (account_number IS NOT NULL AND acceptable_collateral = 't')
);

在这里,我们再次使用 CHECK 约束来检查 account_number 是否不为空,以及贷款专员是否通过检查 acceptable_collateral 列将客户标记为拥有可接受的抵押品。由于正在检查多个列,因此表约束是必要的。

现在是提及的好时机,尽管我们主要在这些示例中使用 CREATE TABLE SQL 命令来创建新表,但你也可以使用 ALTER TABLE 将约束添加到现有表。当使用 ALTER TABLE 时,默认情况下,新约束会导致根据新约束检查表中当前的值。你可以通过包含 NOT VALID 子句来跳过此行为。

为约束创建名称

默认约束名称

当你使用上述语法创建约束时,PostgreSQL 会自动选择一个合理但模糊的名称。在上面的 qualified_borrowers 表的情况下,PostgreSQL 会将约束命名为 qualified_borrowers_check

INSERT INTO qualified_borrowers VALUES (123, false);
ERROR: new row for relation "qualified_borrowers" violates check constraint "qualified_borrowers_check"
DETAIL: Failing row contains (123, f).

当约束被违反时,此名称为你提供有关表和约束类型的信息。但是,如果表上存在多个约束,则更具描述性的名称有助于进行故障排除。

自定义约束名称

你可以选择通过在约束定义前面加上 CONSTRAINT 关键字和名称来指定约束的名称。

添加自定义名称的基本语法如下

CONSTRAINT <constraint_name> <constraint_type_and_details>

例如,如果你想将 qualified_borrowers 表中的约束命名为 loan_worthiness,你可以改为如下定义表

CREATE TABLE qualified_borrowers (
. . .
account_number int,
acceptable_collateral boolean,
. . .
CONSTRAINT loan_worthiness CHECK (account_number IS NOT NULL AND acceptable_collateral = 't')
);

现在,当我们违反约束时,我们会得到更具描述性的标签

INSERT INTO qualified_borrowers VALUES (123, false);
ERROR: new row for relation "qualified_borrowers" violates check constraint "loan_worthiness"
DETAIL: Failing row contains (123, f).

你可以用相同的方式命名列约束

CREATE TABLE teenagers (
. . .
age int CONSTRAINT is_teenager CHECK (age >= 13 AND age <= 19),
. . .
);

PostgreSQL 可用约束列表

现在我们已经介绍了约束工作原理的一些基础知识,我们可以更深入地了解有哪些约束可用以及如何使用它们。

Check 约束

Check 约束是一种通用约束,允许你指定一个表达式,该表达式涉及列值或表值,并评估为布尔值。

你之前已经看过一些 check 约束的示例。Check 约束以关键字 CHECK 开头,然后提供用括号括起来的表达式。对于列约束,这放在数据类型声明之后。对于表约束,这些可以放在它们交互的列定义之后的任何位置。

例如,我们可以创建一个 film_nominations 表,其中包含已获得提名并有资格获得 2019 年长片奖的电影

CREATE TABLE film_nominations (
title text,
director varchar(250),
release_date date CHECK ('01-01-2019' <= release_date AND release_date <= '12-31-2019'),
length int,
votes int,
CHECK (votes >= 10 AND length >= 40)
);

我们有一个列 check 约束,用于检查 release_date 是否在 2019 年内。之后,我们有一个表 check 约束,确保影片已收到足够的票数以获得提名,并且片长符合“长片”类别的资格。

在评估 check 约束时,可接受的值返回 true。如果新记录的值满足所有类型要求和约束,则该记录将被添加到表中

INSERT INTO film_nominations VALUES (
'A great film',
'Talented director',
'07-16-2019',
117,
45
);
INSERT 0 1

产生 false 的值会产生错误,表明约束未得到满足

INSERT INTO film_nominations VALUES (
'A poor film',
'Misguided director',
'10-24-2019',
128,
1
);
ERROR: new row for relation "film_nominations" violates check constraint "film_nominations_check"
DETAIL: Failing row contains (A poor film, Misguided director, 2019-07-16, 128, 1).

在这种情况下,该影片已满足除所需票数以外的所有条件。PostgreSQL 拒绝提交,因为它未通过最终的表 check 约束。

Not null 约束

NOT NULL 约束更加专注。它保证列中的值不能为空。虽然这是一个简单的约束,但它使用非常频繁。

如何在 PostgreSQL 中添加 not null 约束

要将列标记为需要非空值,请在类型声明后添加 NOT NULL

CREATE TABLE national_capitals (
country text NOT NULL,
capital text NOT NULL,
);

在上面的示例中,我们有一个简单的两列表格,将国家/地区映射到其首都。由于这两个都是必需字段,留空没有意义,因此我们添加了 NOT NULL 约束。

现在插入空值会导致错误

INSERT INTO national_capitals VALUES (
NULL,
'London',
);
ERROR: null value in column "country" violates not-null constraint
DETAIL: Failing row contains (null, London).

NOT NULL 约束仅作为列约束起作用(不能用作表约束)。但是,你可以通过在表 CHECK 约束中使用 IS NOT NULL 轻松解决此问题。

例如,这使用表约束提供了等效的保证

CREATE TABLE national_capitals (
country text,
capital text,
CHECK (country IS NOT NULL AND capital IS NOT NULL)
);

Unique 约束

UNIQUE 约束告诉 PostgreSQL,列中的每个值都不能重复。这在许多不同的场景中都很有用,在这些场景中,在多个记录中具有相同的值是不可能的。

例如,任何类型的 ID 列,根据定义,都应具有唯一值。社会安全号码、学生或客户 ID 或产品 UPC(条形码编号)如果不能区分特定的人或项目,则将毫无用处。

UNIQUE 约束可以在列级别指定

CREATE TABLE supplies (
supply_id integer UNIQUE,
name text,
inventory integer
);

它们也可以指定为表约束

CREATE TABLE supplies (
supply_id integer,
name text,
inventory integer,
UNIQUE (supply_id)
);

使用 UNIQUE 表约束的优势之一是,它允许你对列的组合执行唯一性检查。其工作原理是指定两个或多个列,PostgreSQL 应一起评估这些列。单个列中的值可能会重复,但指定的值组合必须是唯一的。

作为一个例子,让我们回顾一下我们之前使用的 national_capitals

CREATE TABLE national_capitals (
country text NOT NULL,
capital text NOT NULL,
);

如果我们想确保我们不为同一对添加多个记录,我们可以在此处向列添加 UNIQUE 约束

CREATE TABLE national_capitals (
country text NOT NULL UNIQUE,
capital text NOT NULL UNIQUE,
);

这将确保国家/地区和首都都仅在每个表中出现一次。但是,一些国家/地区有多个首都。这意味着我们可能有多个条目具有相同的 country 值。这些将不适用于当前设计

INSERT INTO national_capitals VALUES (
'Bolivia',
'Sucre'
);
INSERT INTO national_capitals VALUES (
'Bolivia',
'La Paz'
);
INSERT 0 1
ERROR: duplicate key value violates unique constraint "national_capitals_country_key"
DETAIL: Key (country)=(Bolivia) already exists.

如果我们仍然想确保我们不会最终得到重复的条目,同时允许单个列中存在重复值,则对 countrycapital 的组合进行唯一性检查就足够了

CREATE TABLE national_capitals (
country text,
capital text,
UNIQUE (country, capital)
);

现在,我们可以将玻利维亚的两个首都都添加到表中,而不会出错

INSERT INTO national_capitals VALUES (
'Bolivia',
'Sucre'
);
INSERT INTO national_capitals VALUES (
'Bolivia',
'La Paz'
);
INSERT 0 1
INSERT 0 1

但是,尝试添加相同的组合两次仍然会被约束捕获

INSERT INTO national_capitals VALUES (
'Bolivia',
'Sucre'
);
INSERT INTO national_capitals VALUES (
'Bolivia',
'Sucre'
);
INSERT 0 1
ERROR: duplicate key value violates unique constraint "national_capitals_country_capital_key"
DETAIL: Key (country, capital)=(Bolivia, Sucre) already exists.

主键约束

PRIMARY KEY 约束具有特殊用途。它指示该列可用于唯一标识表中的记录。这意味着它必须是可靠的唯一的,并且每个记录在该列中都必须有一个值。

建议每个表都使用主键,但不是必需的,并且每个表只能有一个主键。主键主要用于标识、检索、修改或删除表中的单个记录。它们允许用户和管理员使用 PostgreSQL 保证与一个记录完全匹配的标识符来定位操作。

让我们使用我们之前看到的 supplies 表作为示例

CREATE TABLE supplies (
supply_id integer UNIQUE,
name text,
inventory integer
);

在这里,我们确定 supply_id 应该是唯一的。如果我们想将此列用作主键(保证唯一性和非空值),我们可以简单地将 UNIQUE 约束更改为 PRIMARY KEY

CREATE TABLE supplies (
supply_id integer PRIMARY KEY,
name text,
inventory integer
);

这样,如果我们需要更新特定供应品的库存量,我们可以使用主键来定位它

INSERT INTO supplies VALUES (
38,
'nails',
5
);
UPDATE supplies set inventory = 10 WHERE supply_id = 38;
INSERT 0 1
UPDATE 1

虽然许多表使用单个列作为主键,但也可以使用一组列作为表约束来创建主键。

national_capitals 表是演示此功能的一个很好的候选对象。如果我们想使用现有列创建主键,我们可以将 UNIQUE 表约束替换为 PRIMARY KEY

CREATE TABLE national_capitals (
country text,
captial text,
PRIMARY KEY (country, capital)
);

外键约束

外键是一个表中的列,它引用另一个表中的列值。这在各种表包含相关数据的场景中是理想的且通常是必要的。数据库轻松连接和引用存储在单独表中的数据的能力是关系数据库的主要功能之一。

例如,你可能有一个 orders 表来跟踪个人订单,以及一个 customers 表来跟踪联系信息和有关客户的信息。将此信息分开是有意义的,因为客户可能有很多订单。但是,能够轻松链接这两个表中的记录以允许更复杂的操作也是有意义的。

如何在 PostgreSQL 中创建外键约束

让我们首先尝试建模 customers

CREATE TABLE customers (
customer_id serial PRIMARY KEY,
first_name text,
last_name text,
phone_number bigint,
);

此表非常简单。它包括用于存储父母的名字、姓氏和电话号码的列。它还指定了一个 ID 列,该列使用 PRIMARY KEY 约束。serial 数据类型用于在未指定 ID 时自动生成序列中的下一个 ID。

对于 orders 表,我们希望能够指定有关个人订单的信息。一个基本的数据是哪个客户下了订单。我们可以使用外键将订单链接到客户,而无需重复信息。我们使用 REFERENCES 约束来执行此操作,该约束定义了与另一个表中的列的外键关系

CREATE TABLE orders (
order_id serial PRIMARY KEY,
order_date date,
customer integer REFERENCES customers
);

在这里,我们指示 orders 表中的 customer 列与 customers 表具有外键关系。由于我们未指定 customers 表中的特定列,因此 PostgreSQL 假定我们要链接到 customers 表中的主键:customer_id

如果我们尝试将不引用有效客户的值插入到 orders 表中,PostgreSQL 将拒绝它

INSERT INTO orders VALUES (
100,
'11-19-2019',
300
);
ERROR: insert or update on table "orders" violates foreign key constraint "orders_customer_fkey"
DETAIL: Key (customer)=(300) is not present in table "customers".

如果我们首先添加客户,我们的订单将被系统接受

INSERT INTO customers VALUES (
300,
'Jill',
'Smith',
'5551235677'
);
INSERT INTO orders VALUES (
100,
'11-19-2019',
300
);
INSERT 0 1
INSERT 0 1

虽然主键是外键的绝佳候选对象,因为它保证仅匹配一个记录,但你也可以使用其他列,只要它们是唯一的。为此,你只需在 REFERENCES 定义中的表名后在括号中指定列。

CREATE TABLE example (
. . .
column type REFERENCES other_table (column)
);

你还可以使用保证唯一性的列集。为此,你需要使用以 FOREIGN KEY 开头的表约束,并引用你在表描述中之前定义的列

CREATE TABLE example (
. . .
FOREIGN KEY (column1, column2) REFERENCES other_table (column1, column2)
);

决定在删除或更新时如何处理外键

定义外键约束时,你需要考虑的一个问题是,当引用的表被删除或更新时该怎么办。

例如,让我们再次看一下 customersorders 表。我们需要指定当我们从 customers 表中删除客户时,如果该客户在 orders 表中具有关联的订单,我们希望系统如何响应。

我们可以从以下选项中选择

  • RESTRICT:选择限制删除意味着,如果 customer 记录被 orders 表中的记录引用,PostgreSQL 将拒绝删除该记录。要删除客户,你必须首先从 orders 表中删除任何关联的记录。只有这样,你才能从客户表中删除该值。
  • CASCADE:选择级联选项意味着,当我们删除 customer 记录时,orders 表中引用它的记录会被删除。这在许多情况下都很有用,但必须谨慎使用,以避免错误删除数据。
  • NO ACTION:no action 选项告诉 PostgreSQL 仅删除客户,而对关联的 orders 记录不做任何处理。如果稍后检查约束,它仍然会导致错误,但这不会在初始删除期间发生。如果没有指定其他操作,这是默认操作。
  • SET NULL:此选项告诉 PostgreSQL 在删除引用的记录时将引用列设置为 null。因此,如果我们从 customers 表中删除客户,则 orders 表中的 customer 列将被设置为 NULL
  • Set DEFAULT:如果选择此选项,则当删除引用的记录时,PostgreSQL 会将引用列更改为默认值。因此,如果 orders 表中的 customer 列具有默认值,并且我们从 customers 表中删除客户,则 orders 值中的记录将被分配默认值。

可以通过添加 ON DELETE 后跟操作来在定义外键约束时指定这些操作。因此,如果我们想在删除客户时从我们的系统中删除关联的订单,我们可以像这样指定它

CREATE TABLE orders (
order_id serial PRIMARY KEY,
order_date date,
customer integer REFERENCES customers ON DELETE CASCADE
);

这些类型的操作也可以在更新引用的列而不是删除列时应用,方法是使用 ON UPDATE 而不是 ON DELETE

Exclusion 约束

我们要讨论的最后一种约束是排除约束。虽然像 CHECK 这样的约束可以单独检查每一行的有效性,但排除约束会相互检查多行的值。UNIQUE 约束是一种特殊的排除约束,它检查每一行对于相关列或多列是否具有不同的值。

例如,您可以使用排除约束来确保两个日期范围之间没有重叠,如下所示

CREATE EXTENSION btree_gist;
CREATE TABLE bookings (
room int,
booking_start date,
booking_end date,
EXCLUDE USING gist (
room WITH =,
daterange(booking_start, booking_end, '[]') WITH &&
)
);

这里,我们有一个酒店预订的创建表语句,其中包含房间号以及预订的开始和结束日期。首先,指定 CREATE EXTENSION btree_gist 以确保我们即将使用的索引方法在数据库中已启用。之后,我们使用 EXCLUDE USING 语法添加排除约束。我们将 gist 指定为索引方法,这告诉 PostgreSQL 如何索引和访问值以进行比较。

然后,我们列出要比较项的方式。我们指定 room 值应使用等号进行比较,这意味着约束将仅匹配具有相同 room 的两行。daterangebooking_startbooking_end 列一起作为日期范围进行检查。我们包含 [] 作为可选的第三个参数,以指示应包含性地比较范围。&& 运算符指定日期范围应检查重叠。

因此,总而言之,此约束确保同一房间不会在重叠的日期被预订。

结论

在本教程中,我们学习了如何使用 PostgreSQL 的约束来精确定义表的有效值。我们讨论了列约束和表约束之间的区别。之后,我们了解了各种类型的约束,并演示了如何使用它们来限制表接受的输入类型。

约束是众多功能之一,可帮助您定义数据结构中的期望。一旦提供了约束,您就可以允许 PostgreSQL 验证任何输入是否符合要求。这是一种使用 PostgreSQL 数据库系统强制执行保证的小方法,以确保您的数据保持一致且有意义。

关于作者
Justin Ellingwood

Justin Ellingwood

自 2013 年以来,Justin 一直在撰写关于数据库、Linux、基础设施和开发者工具的文章。他目前与妻子和两只兔子住在柏林。他通常不必以第三人称写作,这对所有相关方来说都是一种解脱。