PostgreSQL 12 kommer med en ny funktion som heter genererade kolumner . Andra populära RDBMS stöder redan genererade kolumner som "beräknade kolumner" eller "virtuella kolumner." Med Postgres 12 kan du nu använda den i PostgreSQL också. Läs vidare för att lära dig mer.
Vad är en genererad kolumn?
En genererad kolumn är ungefär som en vy, men för kolumner. Här är ett grundläggande exempel:
db=# CREATE TABLE t (w real, h real, area real GENERATED ALWAYS AS (w*h) STORED);
CREATE TABLE
db=# INSERT INTO t (w, h) VALUES (10, 20);
INSERT 0 1
db=# SELECT * FROM t;
w | h | area
----+----+------
10 | 20 | 200
(1 row)
db=#
Vi skapade en tabell t med två vanliga kolumner som heter w och h ,och en genererad kolumn som heter area . Värdet på area beräknas efter skapelsetiden och finns kvar på disken.
Värdet på genererade kolumner beräknas om när raden uppdateras:
db=# UPDATE t SET w=40;
UPDATE 1
db=# SELECT * FROM t;
w | h | area
----+----+------
40 | 20 | 800
(1 row)
db=#
Sådan funktionalitet uppnåddes tidigare vanligtvis med triggers, men med genererade kolumner blir detta mycket mer elegant och renare.
Några punkter du bör känna till om genererade kolumner:
- Uthållighet :För närvarande måste värdet på genererade kolumner bestå och kan inte beräknas direkt vid frågetillfället. Nyckelordet "LAGRAD" måste finnas i kolumndefinitionen.
- Uttrycket :Uttrycket som används för att beräkna värdet måste varaoföränderligt , det vill säga det måste vara deterministiskt. Det kan bero på andra kolumner, men inte andra genererade kolumner, i tabellen.
- Index :Genererade kolumner kan användas i index, men kan inte användas som en partitionsnyckel för partitionerade tabeller.
- Kopiera och pg_dump :Värdena för genererade kolumner utelämnas i utmatningen av kommandona "pg_dump" och "COPY table", eftersom det är onödigt. Du kan uttryckligen inkludera dem i COPY med
COPY (SELECT * FROM t) TO STDOUT
istället förCOPY t TO STDOUT
.
Ett praktiskt exempel
Låt oss lägga till stöd för fulltextsökning i en tabell med hjälp av genererade kolumner. Här är en tabell som lagrar hela texten i alla Shakespeares pjäser:
CREATE TABLE scenes (
workid text, -- denotes the name of the play (like "macbeth")
act integer, -- the act (like 1)
scene integer, -- the scene within the act (like 7)
description text, -- short desc of the scene (like "Macbeth's castle.")
body text -- full text of the scene
);
Så här ser data ut:
shakespeare=# SELECT workid, act, scene, description, left(body, 200) AS body_start
shakespeare-# FROM scenes WHERE workid='macbeth' AND act=1 AND scene=1;
workid | act | scene | description | body_start
---------+-----+-------+-----------------+----------------------------------------------
macbeth | 1 | 1 | A desert place. | [Thunder and lightning. Enter three Witches]+
| | | | +
| | | | First Witch: When shall we three meet again +
| | | | In thunder, lightning, or in rain? +
| | | | +
| | | | Second Witch: When the hurlyburly's done, +
| | | | When the battle's lost and won. +
| | | |
(1 row)
Vi lägger till en kolumn som innehåller lexem i värdet "body". Funktionen to_tsvector returnerar de lexem vi behöver:
shakespeare=# SELECT to_tsvector('english', 'move moving moved movable mover movability');
to_tsvector
-------------------------------------
'movabl':4,6 'move':1,2,3 'mover':5
(1 row)
Typen av värdet som returneras av to_tsvector
är tsvector.
Låt oss ändra tabellen för att lägga till en genererad kolumn:
ALTER TABLE scenes
ADD tsv tsvector
GENERATED ALWAYS AS (to_tsvector('english', body)) STORED;
Du kan se ändringen med \d
:
shakespeare=# \d scenes
Table "public.scenes"
Column | Type | Collation | Nullable | Default
-------------+----------+-----------+----------+----------------------------------------------------------------------
workid | text | | not null |
act | integer | | not null |
scene | integer | | not null |
description | text | | |
body | text | | |
tsv | tsvector | | | generated always as (to_tsvector('english'::regconfig, body)) stored
Indexes:
"scenes_pkey" PRIMARY KEY, btree (workid, act, scene)
Och precis så kan du nu göra fulltextsökningar:
shakespeare=# SELECT
workid, act, scene, ts_headline(body, q)
FROM (
SELECT
workid, act, scene, body, ts_rank(tsv, q) as rank, q
FROM
scenes, plainto_tsquery('uneasy head') q
WHERE
tsv @@ q
ORDER BY
rank DESC
LIMIT
5
) p
ORDER BY
rank DESC;
workid | act | scene | ts_headline
----------+-----+-------+-----------------------------------------------------------
henry4p2 | 3 | 1 | <b>Uneasy</b> lies the <b>head</b> that wears a crown. +
| | | +
| | | Enter WARWICK and Surrey +
| | | +
| | | Earl of Warwick
henry5 | 2 | 2 | <b>head</b> assembled them? +
| | | +
| | | Lord Scroop: No doubt, my liege, if each man do his best.+
| | | +
| | | Henry V: I doubt not that; since we are well persuaded +
| | | We carry not a heart with us from hence
(2 rows)
shakespeare=#
Läs mer
Om du har ett behov av förberäknade/”cachelagrade” data, särskilt med en arbetsbelastning på få skrivningar och många läsningar, bör genererade kolumner hjälpa till att förenkla din applikation/serversida kod mycket.
Du kan läsa v12-dokumentationen av CREATE TABLE och ALTER TABLE för att se den uppdaterade syntaxen.