sql >> Databasteknik >  >> RDS >> Sqlserver

Hur man ignorerar HTML-taggar i SQL Server 2008 Full Text Search

det finns ett filter för .htm- och .html-filer.

för att se om du har filtret installerat, kör denna sql:

SELECT * FROM sys.fulltext_document_types

du borde se:

.htm E0CA5340-4534-11CF-B952-00AA0051FE20 C:\Program Files\Microsoft SQL Server\MSSQL10.MSSQLSERVER\MSSQL\Binn\nlhtml.dll 12.0.6828.0 Microsoft Corporation

.html E0CA5340-4534-11CF-B952-00AA0051FE20 C:\Program Files\Microsoft SQL Server\MSSQL10.MSSQLSERVER\MSSQL\Binn\nlhtml.dll 12.0.6828.0 Microsoft Corporation

så om du kan konvertera din artikelkolumn till varbinary(max), så kan du lägga till ett fulltextindex på den och ange dokumenttypen '.html'

när indexet har fyllts i kan du verifiera sökorden med denna sql:

SELECT display_term, column_id, document_count
FROM sys.dm_fts_index_keywords
(DB_ID('your_db'), OBJECT_ID('your_table')) 


  1. Hur stor är för stor för ett MySQL-bord?

  2. 4 sätt att räkna rader i SQL Server-tabell med för- och nackdelar

  3. Använd Postgres-genererade kolumner i Sequelize-modellen

  4. Varför fungerar inte pi()-funktionen i Oracle med dess JDBC-drivrutin?