sql >> Databasteknik >  >> RDS >> Mysql

Jämför textskillnader mellan två nästan identiska rader/tabeller i MySql

Även om det skulle vara lättare att åstadkomma detta i din applikationskod, är det möjligt via ett par MySQL-funktioner:

delimiter //

drop function if exists string_splitter //
create function string_splitter(
  str text,
  delim varchar(25),
  pos tinyint) returns text
begin
return replace(substring_index(str, delim, pos), concat(substring_index(str, delim, pos - 1), delim), '');
end //

drop function if exists percentage_of_matches //

create function percentage_of_matches(
  str1 text,
  str2 text)returns double
begin
set str1 = trim(str1);
set str2 = trim(str2);
while instr(str1, '  ') do
  set str1 = replace(str1, '  ', ' ');
end while;
while instr(str2, '  ') do
  set str2 = replace(str2, '  ', ' ');
end while;
set @i = 1;
set @numWords = 1 + length(str1) - length(replace(str1, ' ', ''));
set @numMatches = 0;
while @i <= @numWords do
  set @word = string_splitter(str1, ' ', @i);
  if str2 = @word or str2 like concat(@word, ' %') or str2 like concat('% ', @word) or str2 like concat('% ', @word, ' %') then
    set @numMatches = @numMatches + 1;
  end if;
  set @i = @i + 1;
end while;
return (@numMatches / @numWords) * 100;
end //

delimiter ;

Den första funktionen används i den andra, som är den du vill anropa i din kod, som så:

select percentage_of_matches('salt water masala', 'salt masala water');
select percentage_of_matches('water onion maggi milk', 'water onion maggi');



  1. Välj värden från en lista som inte finns i en tabell

  2. MySQL I MELLAN utan villkor

  3. Unik kombination av två kolumner i mysql eller postgres

  4. Driver.getConnection hänger sig med SQLServer-drivrutinen och Java 1.6.0_29