sql >> Databasteknik >  >> RDS >> Mysql

R och MySQL - kontrollera om en rad finns i en tabell innan du skriver till den med dbWriteTable()

Överväg ett av två sätt:en SQL-driven de-dupe- eller R-driven de-dupe-lösning. För det förstnämnda skulle du behöva använda en temp, mellanställningstabell som kör den klassiska LEFT JOIN...IS NULL/NOT EXISTS/NOT IN SQL-fråga. För det senare skulle du importera allt innehåll i en dataram, lägga till din nuvarande df och köra R:s unique() . Det låter dock som att du inte tänker på det senare men jag visar det för framtida läsare.

SQL (med en tillfällig tabell med exakt struktur för måltabellen)

# OVERWRITE TEMP EACH TIME
dbWriteTable(con_hub, value = my_R_dataframe, 
                      name = "table2_temp", 
                      overwrite = TRUE,                        
                      row.names = FALSE)

# RUN LEFT JOIN...IS NULL QUERY (COMPARE COLS --COL1, COL2, COL3-- ADD/REMOVE AS NEEDED)
dbSendQuery(con_hub, paste0("INSERT INTO table2", 
                            " SELECT * FROM table2_temp",
                            " LEFT JOIN table2",
                            "   ON table2_temp.col1 = table2.col1", 
                            "   AND table2_temp.col2 = table2.col2",
                            "   AND table2_temp.col3 = table2.col3",
                            " WHERE table2.col1 IS NULL",
                            "   OR table2.col2 IS NULL",
                            "   OR table2.col3 IS NULL"))

R (läs i tabell 2 data, överväg om du inte belastar resurser för mycket, föredra om du deduperar i alla kolumner)

# RETRIEVE table2 DATA
table2df <- dbGetQuery(con_hub, "SELECT * FROM table2")

# APPEND BOTH DATAFRAMES
stackeddf <- rbind(table2df, my_R_dataframe)

# RETURN UNIQUE ROWS
finaldf <- unique(stackeddf)

# OVERWRITE DESTINATION TABLE EACH TIME
dbWriteTable(con_hub, value = finaldf, 
                      name = "table2", 
                      overwrite = TRUE,                         
                      row.names = FALSE)

# CLEAN UP ENVIRON OF UNNEEDED OBJECTS
rm(table2df, stackeddf, finaldf)
gc()



  1. Frågan går snabbt, men går långsamt i lagrad procedur

  2. WHERE-tillstånd i MySQL med 16 olika frågeexempel

  3. PHP-varning:PHP-start:Det går inte att ladda det dynamiska biblioteket '/usr/lib/php/20151012/msqli.so'

  4. Få återstående dagar, timmar och minuter med mySql