sql >> Databasteknik >  >> RDS >> PostgreSQL

Undvika dubbletter av inlägg utan unika begränsningar i måltabellen?

CDC-komponenterna i den betalda versionen av Talend Studio for Data Integration adresserar utan tvekan detta.

I Open Studio kan du rulla din egen Change-datainsamling baserat på den sammansatta, unika nyckeln (förnamn, efternamn, dob, kön).

  • Använd tUniqueRow på data som kommer från stage_geno_patients, unik i följande kolumner:förnamn, efternamn, dob, kön
  • Mata in det i en tMap
  • Lägg till ytterligare en fråga som indata till tMap, för att utföra uppslag mot tabellen bakom "patients_test", för att hitta en matchning på förnamn, efternamn, dob, kön. Den uppslagningen ska "Ladda om för varje rad" genom att slå upp mot värden från mellanställningsraden
  • Om det inte finns någon matchning, upptäck det och infoga sedan den mellanliggande raden med data i tabellen bakom "patients_test"

F:Kommer du också att uppdatera information? Eller är målet bara att utföra unika infogningar där data inte redan finns?




  1. mysql-processen kan inte stoppas

  2. Samma fråga - olika genomförandeplaner

  3. Multi-tenant rails-applikation:vilka är fördelarna och nackdelarna med olika tekniker?

  4. hur man lägger till en ny kolumn varje gång jag kör ett pythonprogram