sql >> Databasteknik >  >> RDS >> Mysql

Skillnader mellan utf8 och latin1

UTF-8 är förberedd för världsherravälde, Latin1 är det inte.

Om du försöker lagra icke-latinska tecken som kinesiska, japanska, hebreiska, ryska, etc med Latin1-kodning, kommer de att sluta som mojibake . Du kan hitta den inledande texten till denna artikel användbar (och ännu mer om du kan lite Java).

Observera att fullständigt 4-byte UTF-8-stöd endast introducerades i MySQL 5.5. Före den versionen går den bara upp till 3 byte per tecken, inte 4 byte per tecken. Så, den stödde bara BMP-planet och inte t.ex. Emoji-planet. Om du vill ha fullt 4-byte UTF-8-stöd, uppgradera MySQL till minst 5.5 eller välj ett annat RDBMS som PostgreSQL. I MySQL 5.5+ heter det utf8mb4 .



  1. Batch Mode Bitmaps i SQL Server

  2. Ändra avgränsaren till ett kommatecken när du skickar frågeresultat via e-post i SQL Server (T-SQL)

  3. Hur kan jag infoga JSON-objekt i Postgres med Java prepareStatement?

  4. PostgreSQL datum och tid funktioner