分享到

简介

SELECT 命令是在 PostgreSQL 中查询和读取数据库表中记录信息的主要方式。然而,它的用途并不仅限于只读操作SELECT 语法与许多其他命令结合使用,可以针对数据库中的特定记录或字段进行更新、删除和更复杂的操作。

在本指南中,我们将展示 SELECT 的基本语法如何支持从表中收集数据。虽然我们将把该命令的大量可选子句留给其他文章,但希望即使是最基本的组件也能为查询数据提供坚实的基础。这些基础知识只需要您学习几个子句和结构。

SELECT 命令的通用语法

SELECT 命令的基本格式如下:

SELECT <column_names> FROM <table_name> <additional_conditions_and_formatting>;

此语句由几个不同的部分组成:

  • SELECTSELECT 命令本身。此 SQL 语句指示我们希望查询表或视图中的数据。其周围的参数和子句通过定义条件来确定输出的内容和格式。
  • <column_names>SELECT 语句可以返回整个行(由 * 通配符表示)或可用的子集。如果您只想输出特定列,请提供您希望显示的列名,并用逗号分隔。
  • FROM <table_name>FROM 关键字用于指示应查询的视图。在大多数简单查询中,这由包含您感兴趣的数据的单个表组成。
  • <additional_conditions_and_formatting>:大量过滤器、输出修饰符和条件可以作为 SELECT 命令的附加项指定。您可以使用它们来帮助精确定位具有特定属性的数据、修改输出格式或进一步处理结果。

使用 SELECT 指定要显示的列

SELECT 命令的列指定部分要求您命名要显示所查询数据的列。

对于即席查询和数据探索期间,最有用的选项之一是使用星号表示您希望显示所有可用列中的值:

SELECT * FROM my_table;

这将显示 my_table 中的所有记录,因为我们没有提供任何过滤来缩小结果范围。每条记录的所有列将按照它们在表中定义的顺序显示。

您也可以选择通过名称指定可用列的子集。列名用逗号分隔,并按照给定的顺序显示:

SELECT column2, column1 FROM my_table;

这将显示 my_table 中的所有记录,但只显示名为 column2column1 的列,并按该顺序显示。

使用 AS 的列别名修改结果表

您可以选择设置列别名来修改输出中列的名称。

SELECT column1 AS "first column" FROM my_table;

这将显示 my_tablecolumn1 的每个值。但是,输出中的列将被标记为 first column 而不是 column1

如果输出结合了来自可能共享名称的多个表的列名,或者包含尚无名称的计算列,这尤其有用。

使用 ORDER BY 定义排序顺序

ORDER BY 子句可用于根据给定条件对结果行进行排序。通用语法如下:

SELECT * FROM my_table ORDER BY <sort_expression>;

这将显示 my_table 中所有记录的所有列的值。结果将按照占位符 <sort_expression> 所表示的表达式进行排序。

例如,假设我们有一个 customer 表,其中包含 first_namelast_nameaddressphone_number 列。如果我们要按 last_name 的字母顺序显示结果,我们可以使用以下命令:

SELECT * FROM customer ORDER BY last_name;
显示结果

结果按 last_name 列的字母升序排序。

要反转排序顺序,我们可以在 ORDER BY 子句的末尾添加 DESC 修饰符:

SELECT * FROM customer ORDER BY last_name DESC;
显示结果

您也可以按多列排序。在这里,我们首先按 last_name 排序,然后对于所有具有相同 last_name 值的列,再按 first_name 排序。两种排序都是升序:

SELECT * FROM customer ORDER BY last_name, first_name;
显示结果

另一个通常很重要的选项是澄清 NULL 值在排序顺序中的位置。您可以通过为任何排序列添加 NULLS FIRST(默认)或 NULLS LAST 来实现:

SELECT * FROM customer ORDER BY last_name NULLS LAST;

获取 DISTINCT 结果

如果您想在 PostgreSQL 中查找某一列的值范围,可以使用 SELECT DISTINCT 变体。这将为列的每个不同值显示一行。

基本语法如下:

SELECT DISTINCT column1 FROM my_table;

这将为 column1 中的每个唯一值显示一行。

例如,要显示 shirt 表中 color 的所有不同值,您可以输入:

SELECT DISTINCT color FROM shirt;
color
------
blue
green
orange
red
yellow

要显示多列的唯一性,可以添加用逗号分隔的其他列。

例如,这将显示 shirt 表中 colorshirt_size 的所有不同组合:

SELECT DISTINCT color,shirt_size FROM shirt;
color | shirt_size
-------+-----------
blue | M
blue | S
green | M
green | L
green | S
orange | L
orange | M
red | M
yellow | S

这将显示表中 colorshirt_size 的每个唯一组合。

一个通常更灵活的变体是 PostgreSQL 的 SELECT DISTINCT ON 命令。此格式允许您指定一个应组合唯一的列列表,并单独列出您希望显示的列。

通用语法如下,在 SELECT DISTINCT ON 后的括号中列出应唯一的列或多列,然后是您希望显示的列:

SELECT DISTINCT ON (column1) column1, column2 FROM my_table ORDER BY column1;

例如,如果您想为每种衬衫尺寸显示一种颜色,您可以输入:

SELECT DISTINCT ON (shirt_size) color,shirt_size FROM shirt;
color | shirt_size
------+-----------
red | M
green | L
green | S

这将为 shirt_size 中的每个唯一值显示一行。对于每一行,它将显示 color 列,然后是 shirt_size 列。

如果使用 ORDER BY 子句,则选定用于排序的列必须与 DISTINCT ON 括号中选定的列匹配,以便输出具有可预测的结果:

SELECT DISTINCT ON (shirt_size) color,shirt_size FROM shirt ORDER BY shirt_size DESC;
color | shirt_size
------+-----------
green | S
red | M
green | L

结论

在本指南中,我们介绍了使用 SELECT 命令识别和显示表和视图中记录的一些基本方法。SELECT 命令是面向 SQL 的数据库中最灵活和强大的操作之一,具有许多不同的方法来添加子句、条件和过滤。

虽然本指南只涵盖了基本用法,但您在这里学到的通用格式将作为所有其他读取和许多写入查询的基础。学习更准确地过滤和定位结果的方法,将扩展我们今天所涵盖的功能。

作者简介
Justin Ellingwood

Justin Ellingwood

自 2013 年以来,贾斯汀一直致力于撰写关于数据库、Linux、基础设施和开发者工具的文章。他目前与妻子和两只兔子住在柏林。他通常不需要用第三人称写作,这让所有相关方都松了一口气。
© . All rights reserved.