Jag kan inte se några problem med din idé. Kör hårt. Bara för att påpeka att din metod bara är relevant om du vill åsidosätta det inbyggda beteendet som är väldigt likt LD.
Till exempel, med sphinx 1.10-beta, kan du specificera min_infix_len och expand_keywords och använda sphinx inbyggda viktningsmetoder (BM25 och viss proprietär kod) för bra resultat. http://sphinxsearch.com/blog/ 2010/08/17/how-sphinx-relevance-ranking-works/
Glöm inte att memorera dessa frågor och skapa ett uppvärmningsskript.