Med hänvisning till https://mysql.rjweb.org/utf8_collations.html
, jag ser att ı=i i 3 samlingar:utf8_general_ci, utf8_general_mysql500_ci, utf8_turkish_ci. Men för den turkiska sammanställningen, I=ı sorterar före andra accentuerade jag. I alla andra sorteringar ı sorterar trots allt jag, som om det behandlas som ett separat brev.
Under tiden İ=I i alla sorteringar utom utf8_turkish_ci.
Handlingen tjocknar med MySQL 8.0. utf8mb4_tr_0900_ai_ci (endast) har denna ordning:
I=Ì=Í=Î=Ï=Ĩ=Ī=Ĭ=Į=ı sort before i=ì=í=î=ï=ĩ=ī=ĭ=į=İ
Under tiden ä=Ä och de matchar de flesta andra accentuerade A:n för de flesta kollationer (inklusive de turkiska).
Sammanfattning:Det verkar som att utf8[mb4]_general_ci är den enda sammanställningen i 5.7 eller 8.0 som alltid kommer att behandla ett prickfritt-i (eller prickfritt-I) lika med ett 'vanligt i/I och samtidigt ignorera omljud.
Varning:De "allmänna" sammanställningarna testar inte mer än ett tecken åt gången. Det vill säga, en "omljud utan mellanrum" plus en vokal kommer inte att behandlas som lika med kombinationen.
I den länken... Det ena tecknet æ sorteras på samma sätt som de två bokstäverna ae för vissa sammanställningar. Det indikeras av:Aa ae=æ az . I ungefär hälften av de andra sammanställningarna visas tecknet æ behandlas som ett separat brev; detta indikeras av att det står efter az och före b . Eller till och med efter zz för skandinaviska sammanställningar. Detta separata bokstavsbegrepp gäller ibland bokstavspar, till exempel cs (ungerska) och ch (traditionell spanska).