sql >> Databasteknik >  >> RDS >> Mysql

Hur extraherar man två på varandra följande siffror från ett textfält i MySQL?

Om du vill ha mer kraft för reguljära uttryck i din databas kan du överväga att använda LIB_MYSQLUDF_PREG . Detta är ett bibliotek med öppen källkod med MySQL-användarfunktioner som importerar PCRE-biblioteket. LIB_MYSQLUDF_PREG levereras endast i källkodsform. För att använda den måste du kunna kompilera den och installera den på din MySQL-server. Att installera det här biblioteket ändrar inte MySQL:s inbyggda regex-stöd på något sätt. Det gör bara följande ytterligare funktioner tillgängliga:

PREG_CAPTURE extraherar en regexmatchning från en sträng. PREG_POSITION returnerar positionen där ett reguljärt uttryck matchar en sträng. PREG_REPLACE utför en sök-och-ersätt på en sträng. PREG_RLIKE testar om ett regex matchar en sträng.

Alla dessa funktioner tar ett reguljärt uttryck som sin första parameter. Detta reguljära uttryck måste formateras som en Perl-operator för reguljära uttryck. T.ex. för att testa om regex matchar ämnets skiftläge okänsligt, skulle du använda MySQL-koden PREG_RLIKE('/regex/i', subject). Detta liknar PHPs preg-funktioner, som också kräver extra //-avgränsare för reguljära uttryck inuti PHP-strängen.

Om du vill ha något enklare kan du ändra den här funktionen för att bättre passa dina behov.

CREATE FUNCTION REGEXP_EXTRACT(string TEXT, exp TEXT)
-- Extract the first longest string that matches the regular expression
-- If the string is 'ABCD', check all strings and see what matches: 'ABCD', 'ABC', 'AB', 'A', 'BCD', 'BC', 'B', 'CD', 'C', 'D'
-- It's not smart enough to handle things like (A)|(BCD) correctly in that it will return the whole string, not just the matching token.

RETURNS TEXT
DETERMINISTIC
BEGIN
  DECLARE s INT DEFAULT 1;
  DECLARE e INT;
  DECLARE adjustStart TINYINT DEFAULT 1;
  DECLARE adjustEnd TINYINT DEFAULT 1;

  -- Because REGEXP matches anywhere in the string, and we only want the part that matches, adjust the expression to add '^' and '$'
  -- Of course, if those are already there, don't add them, but change the method of extraction accordingly.

  IF LEFT(exp, 1) = '^' THEN 
    SET adjustStart = 0;
  ELSE
    SET exp = CONCAT('^', exp);
  END IF;

  IF RIGHT(exp, 1) = '$' THEN
    SET adjustEnd = 0;
  ELSE
    SET exp = CONCAT(exp, '$');
  END IF;

  -- Loop through the string, moving the end pointer back towards the start pointer, then advance the start pointer and repeat
  -- Bail out of the loops early if the original expression started with '^' or ended with '$', since that means the pointers can't move
  WHILE (s <= LENGTH(string)) DO
    SET e = LENGTH(string);
    WHILE (e >= s) DO
      IF SUBSTRING(string, s, e) REGEXP exp THEN
        RETURN SUBSTRING(string, s, e);
      END IF;
      IF adjustEnd THEN
        SET e = e - 1;
      ELSE
        SET e = s - 1; -- ugh, such a hack to end it early
      END IF;
    END WHILE;
    IF adjustStart THEN
      SET s = s + 1;
    ELSE
      SET s = LENGTH(string) + 1; -- ugh, such a hack to end it early
    END IF;
  END WHILE;

  RETURN NULL;

END


  1. Datatypsprioritet i SQL Server

  2. SQL Server JDBC-fel på Java 8:Drivrutinen kunde inte upprätta en säker anslutning till SQL Server genom att använda Secure Sockets Layer (SSL) kryptering

  3. Relationsdatabaser

  4. SQL Server Temporary Object Caching