Jag har själv kämpat med korrekt utbyte av hela utbudet av UTF-8-tecken mellan Python och MySQL för Emojis skull och andra tecken bortom U+FFFF-kodpunkten.
För att vara säker på att allt fungerade bra var jag tvungen att göra följande:
- se till att
utf8mb4
användes förCHAR
,VARCHAR
ochTEXT
kolumner i MySQL - framtvinga UTF-8 i Python
- framtvinga UTF-8 som ska användas mellan Python och MySQL
För att genomdriva UTF-8 i Python, lägg till följande rad som första eller andra raden i ditt Python-skript:
# -*- coding: utf-8 -*-
För att tvinga fram UTF-8 mellan Python och MySQL, ställ in MySQL-anslutningen enligt följande:
# Connect to mysql.
dbc = MySQLdb.connect(host='###', user='###', passwd='###', db='###', use_unicode=True)
# Create a cursor.
cursor = dbc.cursor()
# Enforce UTF-8 for the connection.
cursor.execute('SET NAMES utf8mb4')
cursor.execute("SET CHARACTER SET utf8mb4")
cursor.execute("SET character_set_connection=utf8mb4")
# Do database stuff.
# Commit data.
dbc.commit()
# Close cursor and connection.
cursor.close()
dbc.close()
På så sätt behöver du inte använda funktioner som encode
och utf8_encode
.