sorteringen är det minsta av dina bekymmer, vad du behöver tänka på är teckenuppsättningen för kolumnen/tabellen/databasen. Sammanställningen (regler som styr hur data jämförs och sorterade ) är bara en följd av det.
MySQL stöder flera Unicode-teckenuppsättningar, utf8
och utf8mb4
vara den mest intressanta. utf8
stöder Unicode-tecken i BMP
, det vill säga en delmängd av hela Unicode. utf8mb4
, tillgängligt sedan MySQL 5.5.3, stöder alla av Unicode.
sorteringen att användas med någon av Unicode-kodningarna är troligen xxx_general_ci
eller xxx_unicode_ci
. Den förra är en allmän sorterings- och jämförelsealgoritm oberoende av språk, den senare är en mer komplett språkoberoende algoritm som stöder fler Unicode-funktioner (t.ex. behandlar "ß" och "ss" som likvärdiga), men är därför också långsammare.
Se https://dev.mysql.com/ doc/refman/5.5/en/charset-unicode-sets.html .