PostgreSQL

了解 PostgreSQL

内容

概述
PostgreSQL 的客户端/服务器架构
PostgreSQL 的默认客户端：psql
使用 PostgreSQL 角色和权限进行身份验证和授权
理解 PostgreSQL 对象层次结构：数据库、模式和表
并发和隔离控制
复制、负载均衡和高可用性
结论

分享到

概述

PostgreSQL 是一个强大的关系型数据库，能够服务于许多不同的用例。在将其用于您的项目之前，最好先了解 PostgreSQL 的工作原理、它与其他关系型数据库有何不同，以及有哪些功能可以帮助您建模和管理数据。

本指南将介绍 PostgreSQL 的架构和特性，让您对数据库系统的工作原理有一个大致的了解。此概述将帮助您理解应用程序架构、用户通常如何与其交互，以及它如何通过扩展和安全功能支持数据完整性和增长。

PostgreSQL 的客户端/服务器架构

与许多关系型数据库系统一样，PostgreSQL 的基本架构遵循客户端-服务器模型。

主要的 PostgreSQL 程序以服务形式运行，负责定义数据结构、存储数据和响应查询。此守护进程侦听来自客户端的连接，客户端可以进行身份验证，然后向服务器发送指令。服务器会响应消息，指示成功、失败、查询结果或其他适当的信息。

这种架构允许 PostgreSQL 系统服务于许多不同的客户端，这些客户端可以本地连接或通过网络连接。主 PostgreSQL 进程为它接收到的每个客户端连接分叉一个新进程。因此，每个分叉都专用于一个客户端连接，所以连接、分叉和数据库会话的数量彼此一致。

概念

服务器：在客户端-服务器架构中，服务器是接受来自外部客户端连接以执行工作的软件。它侦听请求，处理适当的信息，并将任何相关结果返回给用户。
客户端：在客户端-服务器架构中，客户端是用户用于连接和与服务器通信的软件。客户端将用户的请求转发给服务器，并传回任何相关信息。
分叉：分叉是运行中进程的克隆，通常用于帮助控制资源使用、权限级别和创建新的执行环境。
数据库会话：数据库会话是数据库服务器和客户端之间单一、连续的连接。会话具有自己的上下文，在会话生命周期内持续存在，允许在每个会话基础上进行一定程度的状态和配置。

PostgreSQL 的默认客户端：`psql`

用户可以使用各种客户端连接到 PostgreSQL 服务器。作为 PostgreSQL 发行版一部分实现的默认命令行客户端称为 psql。

psql 客户端可以连接到本地或远程数据库，并以批处理或交互方式处理查询。对于自动化用例，身份验证凭据可以存储在专用身份验证文件中，客户端可以从文件中读取查询。

交互式 psql 会话在身份验证后会将用户带到 PostgreSQL 命令提示符。从那里，您可以将 SQL 发送到客户端，并在终端窗口中查看结果或将其管道传输到输出文件。

您还可以通过 psql 客户端中实现的一系列元命令来修改数据库和管理 PostgreSQL 本身。元命令是非 SQL 的“生活质量”快捷方式，以“\”开头，允许您查询有关数据结构和系统的信息。

例如，您可以使用 \dt 元命令列出所有可用表，或使用 \conninfo 元命令显示有关当前连接的信息。在 psql 会话期间，您可以使用 \h 和 \? 元命令分别获取有关 SQL 或元命令的信息。

概念

批处理：批处理是一种以组而不是逐个执行一系列操作的策略。批处理通常是自动化工作流的组成部分，因为它允许脚本和其他进程发送复合请求。
交互式会话：交互式会话是用户使用临时命令与数据库界面交互的数据库会话。这与非交互式模式形成对比，在非交互式模式中，一整套指令无需用户干预即可发送到服务器。
元命令：在 psql 中，元命令是由 psql 本身而不是数据库系统作为 SQL 语句拦截和处理的命令。这些主要是生活质量改进，允许用户获取有关数据库服务器、连接和数据库对象结构的信息，而无需记住复杂的查询。

Prisma.IO 上的相关内容

Prisma Client 是使用 PostgreSQL 连接器处理 PostgreSQL 数据库的另一种强大方式。您可以按照我们的PostgreSQL 入门指南进行尝试。

Prisma 是一个用于 Typescript 和 Node.js 的开源数据库工具包，旨在提高应用程序开发人员在使用数据库时的生产力和信心。

使用 PostgreSQL 角色和权限进行身份验证和授权

PostgreSQL 使用角色和权限来验证谁连接到系统并确定他们被允许执行哪些操作。

在 PostgreSQL 中，角色是特定能力、权限和“拥有”实体的分组。PostgreSQL 不使用“用户”和“组”的独立概念，而是使用角色来表示这两个概念。角色可以对应现实世界中的个人，也可以作为具有特定访问权限的组，其他角色可以成为其成员。

这个系统在组织访问级别方面提供了很大的灵活性。身份验证方法可以根据角色定义，对特定数据库实体的授权可以授予特定角色。作为其他角色成员的角色将从这些角色继承访问权限。

PostgreSQL 有一些重要的默认设置会影响开箱即用的用户登录和权限行为。新安装通常配置为对等身份验证，它允许用户自动对与其操作系统用户匹配的任何 PostgreSQL 角色进行身份验证。基本上，这会将用户身份验证卸载到操作系统。任何具有匹配 PostgreSQL 角色名称的操作系统用户都被假定信任该身份。在数据库上执行有用工作的授权必须单独授予。

概念

角色：在 PostgreSQL 中，角色是个人用户和用户组的替代和组合。用户可以对角色进行身份验证以获得其权限。角色可以成为其他角色的成员，以继承其权限。
对等身份验证：对等身份验证是大多数 PostgreSQL 安装默认配置的默认身份验证机制。对等身份验证允许用户在没有其他凭据的情况下对与其操作系统用户名匹配的 PostgreSQL 角色进行身份验证。对等身份验证基于系统管理员也是数据库管理员的假设。
授权：PostgreSQL 中的授权是向角色声明执行特定操作的权限。角色还可以“授予”成为另一个角色的成员资格，使其继承父角色的任何授权。

理解 PostgreSQL 对象层次结构：数据库、模式和表

在大多数情况下，PostgreSQL 在数据库对象方面遵循传统的关系型数据库命名约定。然而，PostgreSQL 与常见定义的一个不同之处在于它定义模式的方式。

大多数数据库使用“模式”一词来指代数据库中的一般数据库结构或表定义。例如，您可能会看到定义具有产品 ID、描述和计数字段以及相关约束的 product 表的 SQL 被称为 product 表的模式。

然而，PostgreSQL 模式是一个可以在系统中创建和管理的特定数据库对象。理解 PostgreSQL 中对象的层次结构可以帮助您在熟悉系统和阅读文档时避免混淆。

PostgreSQL 的主要“全局”对象是数据库集群，它只是指 PostgreSQL 服务器管理的一组数据库的名称。数据库集群包含数据库、角色和其他“全局”实体。

模式在数据库中定义，作为表、函数、数据类型和运算符的容器。对象名称在模式内必须是唯一的，但可以在不同的模式中重用，这允许用户共享数据库而不会发生命名冲突。它们还有助于通过在数据库中分段和隔离对象来分组对象或管理第三方应用程序。

表和其他对象在模式中创建。默认情况下，如果在定义表和其他对象时未指定替代模式，则使用名为 “public” 的模式。实际上，这使得使用模式进行分段成为一种可选实践。在许多情况下使用 PostgreSQL 模式很有帮助，但如果不需要，您可以忽略它们。

概念

数据库集群：在 PostgreSQL 术语中，数据库集群是由单个 PostgreSQL 服务器管理的数据库和相关对象的集合。数据库集群是 PostgreSQL 服务器管理的环境。
数据库：数据库是数据库集群中的一个对象，它定义模式、角色和其他对象。由于角色是在数据库中定义的，因此数据库是用户进行身份验证的对象。
模式：在 PostgreSQL 中，模式是数据库中的命名空间对象。模式包含表、数据类型、函数和运算符。对象名称在模式内必须是唯一的，但相同的名称可能存在于不同的模式中。
表：表是 PostgreSQL 中的主要数据定义结构。表定义字段和约束以控制可以输入的数据类型。表在其定义的结构中存储数据作为记录。

Prisma.IO 上的相关内容

使用 Prisma Client 时，Prisma 模式中的数据模型等同于 PostgreSQL 中的表。

Prisma 是一个用于 Typescript 和 Node.js 的开源数据库工具包，旨在提高应用程序开发人员在使用数据库时的生产力和信心。

并发和隔离控制

数据库并发和隔离控制有助于系统管理多个用户同时尝试访问相同数据的情况。数据库必须有处理这种情况的策略，以避免不一致的读取、提交冲突的更改和竞态条件。

PostgreSQL 使用一种称为多版本并发控制 (MVCC) 的策略来处理这些情况。MVCC 通过在相关数据的快照上执行 SQL 语句来工作。此数据快照提供事务隔离，确保每个事务都可以独立应用或回滚，并且它们在一致的数据集上操作。

这种并发管理使 PostgreSQL 避免了锁定，锁定是一种在操作持续期间将数据的独占访问权授予一个进程的技术。虽然有助于隔离控制，但锁定会阻止并发访问并影响性能，因为查询会等待锁释放才能访问数据。

PostgreSQL 的 MVCC 实现允许读写语句永不相互阻塞，这可以产生深远的性能影响。提供多级事务隔离，具体取决于您对不同类型隔离问题的容忍度。如果您想使用自己的系统管理更精细的并发范围，还可以使用表级和行级锁定。

概念

事务隔离：事务隔离是一种确保事务原子性和一致性的特性。这意味着事务中的操作要么全部应用于数据，要么全部回滚。事务隔离还保证外部进程在事务持续期间不能更改事务操作的数据。
MVCC：MVCC，或多版本并发控制，是一种通过对数据的一致快照执行操作来实现事务隔离的策略。每个事务都将收到自己的数据副本，以供事务中使用。
锁定：数据库、表或行锁定是一种通过在事务生命周期内赋予进程对特定数据范围的独占访问权来防止不准确读取和避免冲突写入的策略。锁定是有效的，但由于不允许并发访问而严重影响性能。

复制、负载均衡和高可用性

PostgreSQL 提供了各种解决方案，用于将工作负载分散到多个服务器上，或者在主服务器出现问题时切换到辅助服务器。

负载均衡是一种策略，涉及在多个数据库服务器上复制数据并在它们之间交替请求，以增加可以并发执行的工作量。类似地，高可用性是一种策略，允许辅助数据库服务器在出现问题时接管主服务器的职责，从而减少数据不可用的时间。这两种策略都可以在 PostgreSQL 中通过结合预写日志 (WAL) 和复制来实现。

预写日志是一种通过在实际将所有更改应用到数据库之前将其写入日志文件来保证数据完整性的技术。如果事务期间发生故障，PostgreSQL 可以通过检查日志准确确定已应用于数据库的操作。然后可以回滚任何部分应用的事务，因为系统确切知道预期的更改是什么。

WAL 对于负载均衡和高可用性很重要，因为它与复制有关。复制是两个或多个数据库服务器之间镜像数据和所有数据库操作的过程。它是通过在服务器之间复制数据来实现负载均衡和高可用性的主要方法。

PostgreSQL 可以支持许多不同类型的复制，每种类型在粒度、数据丢失保护、性能和复杂性方面都有权衡。复制架构可以是简单的，例如将数据复制到单个备用服务器，也可以是复杂的，其架构通过多个主机中继复制，并具有不同程度的延迟。这些选择为您提供了配置环境的灵活性，以满足您对性能、扩展和数据可用性的需求。

概念

预写日志：预写日志，或 WAL，是一种在服务器故障期间通过在数据库上执行操作之前将预期数据库操作写入持久日志来防止数据丢失的策略。WAL 允许数据库通过回滚部分应用的操作从故障中恢复。这有助于确保系统内的数据处于一致状态。
复制：复制是涉及将数据和数据操作从一台服务器复制到另一台服务器的过程。这允许独立的服务器维护同步的数据集。可以使用不同类型的复制来平衡不同级别的可用性、容错性、性能和复杂性。
主服务器：复制数据时，主服务器（在某些上下文中称为主控服务器）是对可以接受写入查询并维护初始数据集和操作的“主要”服务器的指定。
辅助服务器：复制数据时，辅助服务器（在某些上下文中称为备用服务器）是通过复制执行的每个操作将其数据与主服务器同步的服务器。