sql >> Databasteknik >  >> RDS >> PostgreSQL

Ta bort funktionalitet med spark sql dataframe

Om du vill modifiera (ta bort poster) den faktiska datakällan, dvs tabeller i postgres, skulle Spark inte vara ett bra sätt. Du kan använda jdbc-klienten direkt för att uppnå detsamma.

Om du ändå vill göra detta (på ett spritt sätt baserat på några ledtrådar som du beräknar som en del av dataramar); du kan ha samma jdbc-klientkod skriven i korrespondens med dataram som har logik/triggerinformation för att radera poster och som kan köras på flera arbetare parallellt.



  1. 4 sätt att kontrollera om en tabell finns innan du släpper den i SQL Server (T-SQL)

  2. Ta bort MySQL Ubuntu 14.04 LTS helt

  3. MySQL CSV Import - datum angett som 0000-00-00 00:00:00 om tidsstämpeln har millisekunder?

  4. Omvänd koordinater i PostgreSQL-polygonkolumnen