sql >> Databasteknik >  >> RDS >> Mysql

ERSÄTT rader i mysql databastabell med pandas DataFrame

Med lanseringen av pandas 0.24.0 finns det nu en officiellt sätt för att uppnå detta genom att skicka en anpassad infogningsmetod till to_sql fungera.

Jag kunde uppnå beteendet hos REPLACE INTO genom att skicka denna callable till to_sql :

def mysql_replace_into(table, conn, keys, data_iter):
    from sqlalchemy.dialects.mysql import insert
    from sqlalchemy.ext.compiler import compiles
    from sqlalchemy.sql.expression import Insert

    @compiles(Insert)
    def replace_string(insert, compiler, **kw):
        s = compiler.visit_insert(insert, **kw)
        s = s.replace("INSERT INTO", "REPLACE INTO")
        return s

    data = [dict(zip(keys, row)) for row in data_iter]

    conn.execute(table.table.insert(replace_string=""), data)

Du skulle klara det så här:

df.to_sql(db, if_exists='append', method=mysql_replace_into)

Alternativt, om du vill ha beteendet hos INSERT ... ON DUPLICATE KEY UPDATE ... istället kan du använda detta:

def mysql_replace_into(table, conn, keys, data_iter):
    from sqlalchemy.dialects.mysql import insert

    data = [dict(zip(keys, row)) for row in data_iter]

    stmt = insert(table.table).values(data)
    update_stmt = stmt.on_duplicate_key_update(**dict(zip(stmt.inserted.keys(), 
                                               stmt.inserted.values())))

    conn.execute(update_stmt)

Tack till https://stackoverflow.com/a/11762400/1919794 för kompileringsmetoden.



  1. Välj i MySQL där alla rader uppfyller ett villkor

  2. Databasprofilering i IRI Workbench

  3. Uppladdning av CSV-fil för att hantera statusuppdatering och infoga nya poster

  4. MySql, kombinerar datum- och tidskolumn till en tidsstämpel