sql >> Databasteknik >  >> RDS >> Oracle

hitta saknade nummer från sekvensen efter att ha fått sekvens från en sträng?

Du vill inte titta på dual alls här; absolut inte försöka infoga. Du måste spåra de högsta och lägsta värdena du har sett när du itererar genom slingan. baserat på några av elementen i ename representerar datum Jag är ganska säker på att du vill att alla dina matchningar ska vara 0-9 , inte 1-9 . Du hänvisar också till markörnamnet när du kommer åt dess fält, istället för postvariabelns namn:

  FOR List_ENAME_rec IN List_ENAME_cur loop
    if REGEXP_LIKE(List_ENAME_rec.ENAME,'emp[-][0-9]{4}[_][0-9]{2}[_][0-9]{2}[_][0-9]{2}[_][0-9]{4}[_][G][1]') then 
      V_seq := substr(List_ENAME_rec.ename,5,4);
      V_Year := substr(List_ENAME_rec.ename,10,2);
      V_Month := substr(List_ENAME_rec.ename,13,2);
      V_day := substr(List_ENAME_rec.ename,16,2);

      if min_seq is null or V_seq < min_seq then
        min_seq := v_seq;
      end if;
      if max_seq is null or V_seq > max_seq then
        max_seq := v_seq;
      end if;

    end if;
  end loop;

Med värden i tabellen för emp-1111_14_01_01_1111_G1 och emp-1115_14_02_02_1111_G1 , som rapporterar max_seq 1115 min_seq 1111 .

Om du verkligen ville involvera dual kunde du göra detta i slingan, istället för om/då/tilldela mönstret, men det är inte nödvändigt:

      select least(min_seq, v_seq), greatest(max_seq, v_seq)
      into min_seq, max_seq
      from dual;

Jag har ingen aning om vad proceduren kommer att göra; det verkar inte finnas något samband mellan det du har i test1 och de värden du hittar.

Du behöver dock ingen PL/SQL för detta. Du kan få min/max-värdena från en enkel fråga:

select min(to_number(substr(ename, 5, 4))) as min_seq,
  max(to_number(substr(ename, 5, 4))) as max_seq
from table1
where status = 2
and regexp_like(ename,
  'emp[-][0-9]{4}[_][0-9]{2}[_][0-9]{2}[_][0-9]{2}[_][0-9]{4}[_][G][1]')

   MIN_SEQ    MAX_SEQ
---------- ----------
      1111       1115 

Och du kan använda dem för att skapa en lista över alla värden i det intervallet:

with t as (
  select min(to_number(substr(ename, 5, 4))) as min_seq,
    max(to_number(substr(ename, 5, 4))) as max_seq
  from table1
  where status = 2
  and regexp_like(ename,
    'emp[-][0-9]{4}[_][0-9]{2}[_][0-9]{2}[_][0-9]{2}[_][0-9]{4}[_][G][1]')
)
select min_seq + level - 1 as seq
from t
connect by level <= (max_seq - min_seq) + 1;

       SEQ
----------
      1111 
      1112 
      1113 
      1114 
      1115 

Och ett lite annorlunda vanligt tabelluttryck för att se vilka av dessa som inte finns i din tabell, vilket jag tror är vad du är ute efter:

with t as (
  select to_number(substr(ename, 5, 4)) as seq
  from table1
  where status = 2
  and regexp_like(ename,
    'emp[-][0-9]{4}[_][0-9]{2}[_][0-9]{2}[_][0-9]{2}[_][0-9]{4}[_][G][1]')
),
u as (
  select min(seq) as min_seq,
    max(seq) as max_seq
  from t
),
v as (
  select min_seq + level - 1 as seq
  from u
  connect by level <= (max_seq - min_seq) + 1
)
select v.seq as missing_seq
from v
left join t on t.seq = v.seq
where t.seq is null
order by v.seq;

MISSING_SEQ
-----------
       1112 
       1113 
       1114 

eller om du föredrar:

...
select v.seq as missing_seq
from v
where not exists (select 1 from t where t.seq = v.seq)
order by v.seq;

SQL Fiddle .

Baserat på kommentarer tror jag att du vill ha de saknade värdena för sekvensen för varje kombination av de andra elementen i ID:t (ÅÅ_MM_DD). Detta ger dig denna uppdelning:

with t as (
  select to_number(substr(ename, 5, 4)) as seq,
    substr(ename, 10, 2) as yy,
    substr(ename, 13, 2) as mm,
    substr(ename, 16, 2) as dd
  from table1
  where status = 2
  and regexp_like(ename,
    'emp[-][0-9]{4}[_][0-9]{2}[_][0-9]{2}[_][0-9]{2}[_][0-9]{4}[_][G][1]')
),
r (yy, mm, dd, seq, max_seq) as (
  select yy, mm, dd, min(seq), max(seq)
  from t
  group by yy, mm, dd
  union all
  select yy, mm, dd, seq + 1, max_seq
  from r
  where seq + 1 <= max_seq
)
select yy, mm, dd, seq as missing_seq
from r
where not exists (
  select 1 from t
  where t.yy = r.yy
  and t.mm = r.mm
  and t.dd = r.dd
  and t.seq = r.seq
)
order by yy, mm, dd, seq;

Med utdata som:

YY   MM   DD    MISSING_SEQ 
---- ---- ---- -------------
14   01   01            1112 
14   01   01            1113 
14   01   01            1114 
14   02   02            1118 
14   02   02            1120 
14   02   03            1127 
14   02   03            1128 

SQL-fiol .

Om du vill leta efter ett visst datum kallfiltrerar du det (antingen i t , eller den första grenen i r ), men du kan också ändra regexmönstret för att inkludera de fasta värdena; så att leta efter 14 06 mönstret skulle vara 'emp[-][0-9]{4}_14_06_[0-9]{2}[_][0-9]{4}[_][G][1]' , till exempel. Det är dock svårare att generalisera, så ett filter (where t.yy = '14' and t.mm = '06' kan vara mer flexibel.

Om du insisterar på att ha detta i en procedur kan du göra datumelementen valfria och ändra regexmönstret:

create or replace procedure show_missing_seqs(yy in varchar2 default '[0-9]{2}',
  mm in varchar2 default '[0-9]{2}', dd in varchar2 default '[0-9]{2}') as

  pattern varchar2(80);
  cursor cur (pattern varchar2) is
    with t as (
      select to_number(substr(ename, 5, 4)) as seq,
        substr(ename, 10, 2) as yy,
        substr(ename, 13, 2) as mm,
        substr(ename, 16, 2) as dd
      from table1
      where status = 2
      and regexp_like(ename, pattern)
    ),
    r (yy, mm, dd, seq, max_seq) as (
      select yy, mm, dd, min(seq), max(seq)
      from t
      group by yy, mm, dd
      union all
      select yy, mm, dd, seq + 1, max_seq
      from r
      where seq + 1 <= max_seq
    )
    select yy, mm, dd, seq as missing_seq
    from r
    where not exists (
      select 1 from t
      where t.yy = r.yy
      and t.mm = r.mm
      and t.dd = r.dd
      and t.seq = r.seq
    )
    order by yy, mm, dd, seq;
begin
  pattern := 'emp[-][0-9]{4}[_]'
    || yy || '[_]' || mm || '[_]' || dd
    || '[_][0-9]{4}[_][G][1]';
  for rec in cur(pattern) loop
    dbms_output.put_line(to_char(rec.missing_seq, 'FM0000'));
  end loop;
end show_missing_seqs;
/

Jag vet inte varför du insisterar på att det måste göras så här eller varför du vill använda dbms_output eftersom du förlitar dig på att klienten/uppringaren visar det; vad kommer ditt jobb att göra med resultatet? Du kan göra detta till en sys_refcursor vilket skulle vara mer flexibelt. men hur som helst, du kan kalla det så här från SQL*Plus/SQL-utvecklaren:

set serveroutput on
exec show_missing_seqs(yy => '14', mm => '01');

anonymous block completed
1112
1113
1114



  1. ora-01722 ogiltigt nummer använder count(1) på minusoperatorn för två vyer

  2. Snabba upp MySQL-anslutningen för att söka efter dubbletter

  3. Drivrutin:[email protected] returnerade null för URL... Under implementeringen av vårstart till Heroku

  4. Få åtkomst till Postgres fjärrserver med pgAdmin