sql >> Databasteknik >  >> RDS >> PostgreSQL

Fyll tabellen med data för saknat datum (postgresql, redshift)

Titta på idén bakom frågan:

select distinct on (domain, new_date) *
from (
    select new_date::date 
    from generate_series('2016-04-12', '2016-04-17', '1d'::interval) new_date
    ) s 
left join a_table t on date <= new_date
order by domain, new_date, date desc;

  new_date  |     domain      |    date    | visitors | hits  
------------+-----------------+------------+----------+-------
 2016-04-12 | www.domain1.com | 2016-04-12 |     1231 | 23423
 2016-04-13 | www.domain1.com | 2016-04-13 |     1374 | 26482
 2016-04-14 | www.domain1.com | 2016-04-13 |     1374 | 26482
 2016-04-15 | www.domain1.com | 2016-04-13 |     1374 | 26482
 2016-04-16 | www.domain1.com | 2016-04-13 |     1374 | 26482
 2016-04-17 | www.domain1.com | 2016-04-17 |     1262 | 21493
(6 rows)

Du måste välja start- och slutdatum enligt dina krav. Frågan kan vara ganska dyr (du nämnde om miljarder luckor) så använd den med försiktighet (testa på en mindre datamängd eller utför stegvis).

I avsaknad av generate_series() du kan skapa din egen generator. Här är ett intressant exempel . Visningar från den citerade artikeln kan användas istället för generate_series() . Till exempel, om du behöver perioden '2016-04-12' + 5 days :

select distinct on (domain, new_date) *
from (
    select '2016-04-12'::date+ n new_date
    from generator_16
    where n < 6
    ) s 
left join a_table t on date <= new_date
order by domain, new_date, date desc;

du får samma resultat som i det första exemplet.



  1. Vad i helvete är en DTU?

  2. Stöder din ODBC-drivrutin användardatakällor?

  3. ClassNotFoundException med Elastic Beanstalk och Tomcat 7

  4. SELECT AS-kolumnen finns inte i WHERE-satsen