sql >> Databasteknik >  >> RDS >> PostgreSQL

Postgresql PÅ KONFLIKT i sqlalchemy

Med Postgres 9.6.1, sqlachemy 1.1.4 och psychopg2 2.6.2:

  1. Konvertera din datastruktur till en ordbok. Från Pandas är det

    import pandas
    from sqlalchemy import MetaData
    from sqlalchemy.dialects.postgresql import insert
    import psycopg2
    
    # The dictionary should include all the values including index values
    insrt_vals = df.to_dict(orient='records')
    
  2. Anslut till databasen via sqlalchemy. Prova istället psycog2-drivrutinen under och den inbyggda COPY-funktionen, som kringgår all postgres-indexering.

    csv_data = os.path.realpath('test.csv')
    con = psycopg2.connect(database = 'db01', user = 'postgres')
    cur = con.cursor()
    cur.execute("\copy stamm_data from '%s' DELIMITER ';' csv header" % csv_data)
    con.commit()
    
  3. Kör

    results = engine.execute(do_nothing_stmt)
    # Get number of rows inserted
    rowcount = results.rowcount
    

Varning:

Den här metoden fungerar inte med NaT är ur lådan.

Allt tillsammans

tst_df = pd.DataFrame({'colA':['a','b','c','a','z', 'q'],
              'colB': pd.date_range(end=datetime.datetime.now() , periods=6),
              'colC' : ['a1','b2','c3','a4','z5', 'q6']})


insrt_vals = tst_df.to_dict(orient='records')
engine =      sqlalchemy.create_engine("postgresql://user:[email protected]/postgres")
connect = engine.connect()
meta = MetaData(bind=engine)
meta.reflect(bind=engine)
table = meta.tables['tstbl']
insrt_stmnt = insert(table).values(insrt_vals)

do_nothing_stmt  = insrt_stmnt.on_conflict_do_nothing(index_elements=['colA','colB'])
results = engine.execute(do_nothing_stmt)

Istället för steg 2 och 3 använder du psycog2 drivrutinen med kopieringskommandot i postgres är snabbare för större filer (närmar sig en spelning) eftersom den stänger av all tabellindexering.

csv_data = os.path.realpath('test.csv')


  1. Hur man övervakar HAProxy Metrics med ClusterControl

  2. 5 enkla steg för att komma igång med MariaDB och Tableau

  3. Få de första 10 oanvända manual_sequence-numren

  4. PostgreSQL JDBC-drivrutinen fungerar inte för Heroku DB Connection