sql >> Databasteknik >  >> RDS >> Oracle

Varför lägger Oracle till en dold kolumn här?

I Oracle release 11g har Oracle introducerat en ny optimeringsteknik för att förbättra prestandan för DDL-operationer. Den här nya funktionen tillåter extremt snabb körningstid när du lägger till en NOT NULL kolumn med standardvärde till en befintlig tabell. Sedan release 12c har DDL-optimeringen utökats till att omfatta NULL kolumner med standardvärde.

Överväg att följa testtabell med 1 000 000 rader:

sql> create table xxy
as select rownum a from dual connect by level <= 1e6
;
sql> select /*+ gather_plan_statistics */ count(1) from xxy;
sql> select * from table(dbms_xplan.display_cursor); 

Nu ska vi lägga till en extra inte null-kolumn med ett standardvärde i olika sessioner för 11g och 12c:

11g> alter table xxy add b number default 1;
     --Table XXY altered. Elapsed: 00:01:00.998

12c> alter table xxy add b number default 1;
     --Table XXY altered. Elapsed: 00:00:00.052

Lägg märke till skillnaden i exekveringstiden:1M rader uppdaterade på 5 ms !?

Utförandeplanen visar:

11g> select count(1) from xxy where b = 1;
  COUNT(1)
----------
   1000000
11g> select * from table(dbms_xplan.display_cursor);
---------------------------------------------------------------------------
| Id  | Operation          | Name | Rows  | Bytes | Cost (%CPU)| Time     |
---------------------------------------------------------------------------
|   0 | SELECT STATEMENT   |      |       |       |  1040 (100)|          |
|   1 |  SORT AGGREGATE    |      |     1 |    13 |            |          |
|*  2 |   TABLE ACCESS FULL| XXY  |   898K|    11M|  1040   (1)| 00:00:13 |
---------------------------------------------------------------------------
Predicate Information (identified by operation id):
---------------------------------------------------
   2 - filter("B"=1)
Note
-----
   - dynamic sampling used for this statement (level=2)

12c> select count(1) from xxy where b = 1;
12c> select * from table(dbms_xplan.display_cursor);
---------------------------------------------------------------------------
| Id  | Operation          | Name | Rows  | Bytes | Cost (%CPU)| Time     |
---------------------------------------------------------------------------
|   0 | SELECT STATEMENT   |      |       |       |   429 (100)|          |
|   1 |  SORT AGGREGATE    |      |     1 |     5 |            |          |
|*  2 |   TABLE ACCESS FULL| XXY  |  1000K|  4882K|   429   (2)| 00:00:01 |
---------------------------------------------------------------------------
Predicate Information (identified by operation id):
---------------------------------------------------
   2 - filter(DECODE(TO_CHAR(SYS_OP_VECBIT("SYS_NC00002$",0)),NULL,NVL("
              B",1),'0',NVL("B",1),'1',"B")=1)
Note
-----
   - statistics feedback used for this statement

Utförandeplanen på 12c visar i motsats till 11g en komplex predikatdel som involverar en ny intern kolumn SYS_NC00006$ .

Detta predikat indikerar att Oracle internt fortfarande överväger att B-kolumnen potentiellt kan innehålla icke-standardvärden. Det betyder - Oracle uppdaterar först inte fysiskt varje rad med standardvärdet.

Varför en ny intern kolumn SYS_NC00006$ är skapad?

12c> select column_name, virtual_column, hidden_column, user_generated 
from user_tab_cols
where table_name = 'XXY'
;
COLUMN_NAME      VIR HID USE
---------------- --- --- ---
B                NO  NO  YES
SYS_NC00002$     NO  YES NO 
A                NO  NO  YES

12c> select a, b, SYS_NC00002$ hid from xxy where a in (1,10);

        A          B HID            
---------- ---------- ----------------
         1          1                 
        10          1                 

12c> update xxy set b=1 where a=10 and b=1;
1 row updated.

12c> select a, b, SYS_NC00002$ hid from xxy where a in (1,10);
         A          B HID            
---------- ---------- ----------------
         1          1                 
        10          1 01              

Lägg märke till skillnaden i värdena för B och relaterade interna kolumner. Oracle kollar helt enkelt igenom sin systemgenererade interna kolumn (t.ex. SYS_NC00006$ ) och via SYS_OP_VECBIT funktion om man ska överväga standardvärdet för B-kolumnen eller det verkliga värdet modifierat via en explicit DML-sats.

Vad är det med två separata alter-satser?

12c> alter table xxy add (b integer);
12c> alter table xxy modify b default 1;

12c> select count(b), count(coalesce(b,0)) nulls  from xxy where b = 1 or b is null;

  COUNT(B)      NULLS
---------- ----------
         0    1000000

Värdet på ny kolumn förblir NULL för alla rader. Inga riktiga uppdateringar behövs därför kommer DDL-satsen inte att optimeras.

Här är en OTN-artikel som förklarar den nya DDL-optimeringen mer i detalj.




  1. Finns det ett bästa sätt att undvika exekvering av processer mer än en gång i Oracle?

  2. PostgreSQL COPY csv inklusive citat

  3. Håna en MySQL-databas i Python

  4. Mysql Left Join Null Result