sql >> Databasteknik >  >> NoSQL >> Redis

Vad är en bra strategi för att gruppera liknande ord?

Ta en titt på "fuzzy matching". Några bra verktyg i tråden nedan som beräknar likheter mellan strängar.

Jag är särskilt förtjust i difflib-modulen

>>> get_close_matches('appel', ['ape', 'apple', 'peach', 'puppy'])
['apple', 'ape']
>>> import keyword
>>> get_close_matches('wheel', keyword.kwlist)
['while']
>>> get_close_matches('apple', keyword.kwlist)
[]
>>> get_close_matches('accept', keyword.kwlist)
['except']

https://stackoverflow.com/questions/682367/good-python-modules-for-fuzzy-string-comparison



  1. Ta bort blanksteg (ledande och efterföljande) från strängvärde

  2. Tillåter Redis endast strängrepresentation men inte numeriskt värde

  3. Hur Hadoop fungerar – Förstå hur Hadoop fungerar

  4. Hur man hittar dokument som matchar flera kriterier