Här är fyra alternativ för att returnera rader som innehåller gemener i MariaDB.
Exempeldata
Anta att vi har en tabell med följande data:
SELECT c1 FROM t1;
Resultat:
+----------------+ | c1 | +----------------+ | CAFÉ | | Café | | café | | 1café | | eCafé | | James Bond 007 | | JB 007 | | 007 | | NULL | | | | É | | É 123 | | é | | é 123 | | ø | | Ø | +----------------+
Vi kan använda följande metoder för att returnera de rader som innehåller gemener.
Alternativ 1:Jämför med en POSIX-teckenklass
Vi kan använda REGEXP
operatorn för att utföra en matchning av ett reguljärt uttrycksmönster.
Ett enkelt alternativ är att jämföra vår kolumn med [:lower:]
POSIX teckenklass:
SELECT c1 FROM t1
WHERE c1 REGEXP '[[:lower:]]';
Resultat:
+----------------+ | c1 | +----------------+ | Café | | café | | 1café | | eCafé | | James Bond 007 | | é | | é 123 | | ø | +----------------+
RLIKE
är en synonym för REGEXP
, så att vi kan ersätta REGEXP
med RLIKE
för att få samma resultat:
SELECT c1 FROM t1
WHERE c1 RLIKE '[[:lower:]]';
Alternativ 2:Jämför med UPPER()
Sträng
Ett annat alternativ är att använda UPPER()
funktion för att jämföra det ursprungliga värdet med dess motsvarighet i versaler:
SELECT c1 FROM t1
WHERE BINARY UPPER(c1) <> BINARY c1;
Resultat:
+----------------+ | c1 | +----------------+ | Café | | café | | 1café | | eCafé | | James Bond 007 | | é | | é 123 | | ø | +----------------+
Genom att använda inte lika med (<>
) operator (du kan alternativt använda !=
istället för <>
om du föredrar det), returnerar vi bara de rader som skiljer sig från sina versaler. Anledningen till att vi gör detta är att om ett värde är detsamma som dess versaler, så var det redan versaler till att börja med (och vi vill inte returnera det).
Som standard utför MariaDB en skiftlägesokänslig sökning, så jag använder BINARY
operatör för att få en skiftlägeskänslig sökning.
Detta kan också göras så här:
SELECT c1 FROM t1
WHERE BINARY(UPPER(c1)) <> BINARY(c1);
Alternativ 3:Jämför med de faktiska tecknen
Ett annat alternativ är att använda REGEXP
operator med ett reguljärt uttrycksmönster som uttryckligen inkluderar varje gement tecken som vi vill matcha:
SELECT c1 FROM t1
WHERE BINARY c1 REGEXP BINARY '[abcdefghijklmnopqrstuvwxyz]';
Resultat:
+----------------+ | c1 | +----------------+ | Café | | café | | 1café | | eCafé | | James Bond 007 | +----------------+
Denna gång returneras färre rader än i de tidigare exemplen. Det beror på att jag inte angav tecken som é
och ø
, som returnerades i dessa exempel. Vårt resultat innehåller é
men den raden returnerades bara eftersom den också innehåller andra gemener som gör match.
Därför måste du se till att du har alla giltiga tecken täckta om du använder det här alternativet.
Alternativ 4:Jämför med en rad tecken
Ett annat sätt att göra det är att specificera intervallet av tecken vi vill matcha:
SELECT c1 FROM t1
WHERE BINARY c1 REGEXP BINARY '[a-z]';
Resultat:
+----------------+ | c1 | +----------------+ | Café | | café | | 1café | | eCafé | | James Bond 007 | +----------------+