utf8
är en kodning (hur man representerar unicode-tecken som en serie byte), inte en sortering (vilket tecken går före vilket).
Jag tror att Postgres 10-kollationsmotsvarigheten för utf8_general_ci
(eller modernare utf8_unicode_ci
) kallas und-x-icu
- detta är en odefinierad sammanställning (inte definierad för något verklig språk) som tillhandahålls av ett ICU-bibliotek. Denna sammanställning skulle sortera ganska rimligt tecken från de flesta språk.
ICU-stöd är en ny funktion som lagts till i PostgreSQL 10, så denna sammanställning är inte tillgänglig för äldre PostgreSQL-versioner eller när den är inaktiverad under kompilering. Innan dess använde Postgres operativsystem tillhandahållet sorteringsstöd, vilket skiljer sig mellan olika operativsystem.