sql >> Databasteknik >  >> RDS >> PostgreSQL

Optimal chunksize-parameter i pandas.DataFrame.to_sql

I mitt fall infogades 3M rader med 5 kolumner på 8 minuter när jag använde pandas to_sql funktionsparametrar som chunksize=5000 och method='multi'. Detta var en enorm förbättring eftersom det blev väldigt svårt för mig att infoga 3M-rader med python i databasen.



  1. Stoppa (lång) körning av SQL-fråga i PostgreSQL när session eller begäranden inte längre existerar?

  2. MySQL beställ efter före grupp efter

  3. Migrera gradvis från SQL Server till PostgreSQL

  4. Gruppera efter och lägg till kolumner