sql >> Databasteknik >  >> RDS >> Mysql

Att ladda mysql-tabellen till python tar väldigt lång tid jämfört med R

Tack vare användbara kommentarer, särskilt från @roganjosh, verkar det som att problemet är att standardmysql-anslutningen är skriven i python snarare än C, vilket gör den väldigt långsam. Lösningen är att använda MySQLdb , som är en inbyggd C-kontakt.

I min speciella installation, att köra python 3 med anaconda, var det inte möjligt eftersom MySQLdb stöds endast i python 2. Det finns dock en implementering av MySQLdb för python 3 under namnet mysqlclient .

Med den här implementeringen är tiden nere på cirka 5 minuter för att läsa hela tabellen, inte lika snabbt som R, men mycket mindre än de 40 eller så det tog innan.

Jag är fortfarande öppen för förslag som skulle göra det snabbare, men min gissning är att det här är så bra som det kommer att bli.



  1. Två partitionerande egenheter

  2. Snabbaste metoden för att ta MySQL Backup and Restore

  3. ClusterControl CMON HA för distribuerad databas hög tillgänglighet - del två (GUI Access Setup)

  4. SQL-fråga för att kontrollera om ett namn börjar och slutar med en vokal