sql >> Databasteknik >  >> RDS >> Mysql

Wordnet SQL-förklaring

WordNet är en supercool orddatabas. Jag har själv undersökt det. Jag kommer att lista mina resultat nedan - och förhoppningsvis kommer det att hjälpa dig att förstå tabellerna bättre.

Synsettabellen Synsets-tabellen är en av de viktigaste tabellerna i databasen. Den ansvarar för att innehålla alla definitioner inom WordNet. Varje rad i synset-tabellen har en synsetid, en definition, en pos (orddelarfält) och en lexdomainid (som länkar till lexdomain-tabellen) Det finns 117373 synsets i WordNet-databasen.

The Words Table WordNet har också en "ord"-tabell, som bara har två fält:ett wordid och ett "lemma". Ordtabellen är ansvarig för att inrymma alla lemman (basord) i Wordnet-databasen. Det finns 146625 poster i denna tabell

Så .. hur är dessa två tabeller länkade? Svaret? Sensbordet!

The Sense Table Senstabellen är ansvarig för att länka samman ord (i ordtabellen), med definitioner (i synsettabellen). Posterna i meningstabellen hänvisas till som "ord-sensepar" - eftersom varje parning av ett ordid med ett synset är en fullständig betydelse av ett ord - en "känsla av ordet".
Det finns totalt 206 354 ordinnehåll i WordNet-databasen.

Lexdomains-tabellen Lexdomains-tabellen refereras till av sense-tabellen och används för att definiera vilken lexikal domän ett ord-sens-par tillhör. Det finns 45 lexikaliska domäner i lexdomains-tabellen. Lexdomain-tabellen är därför WordNets sätt att "tagga" ett ord-sens-par. Det är dock ganska begränsat, eftersom ett ord-inne-par bara kan tillhöra EN lexikal domän.

De 45 lexikaliska domänerna inkluderar:

Adjektiv: allt, pert

Adverb alla

Substantiv toppar, agera, djur, artefakt, attribut, kropp, kognition, kommunikation, händelse, känsla, mat, grupp, plats, motiv, objekt, person, fenomen, växt, innehav, process, kvantitet, linkdef, form, tillstånd, substans, tid,

Verb kropp, förändring, kognition, kommunikation, konkurrens, konsumtion, kontakt, skapande, känsla, rörelse, perception, innehav, social, stativ, väder, ppl

Tabell med skiftlägen Vissa ord i ordtabellen har naturligtvis den första bokstaven versal, dvs. "A-lag". Eftersom ordtabellen lagrar alla ord som gemener, använder WordNet den här tabellen för att ange versalversionen av ordet. Det finns 40313 poster i den här tabellen.

Det finns många andra tabeller i WordNet DB, när jag har undersökt dem kommer jag att skriva igen.

Hitta dina synonymer För att svara på din fråga om synonymer - Du måste göra följande.

Låt oss säga att du vill hitta synonymerna för ordet "Bär". För att göra det skulle du först söka i ordtabellen efter ett lemma som matchar ordet "bära". Detta skulle ge wordid 21253. Du skulle sedan söka i sinnestabellen för att hitta alla ord-sens par för ordet bära. Detta ger 41 resultat - varje resultat listar wordid 21253, och en senseid (som är index för ord-sens paret) och en synsetid.

Nu skulle du behöva fråga synset-tabellen för var och en av de synsetider som returneras så att du kan komma åt det associerade definitionsfältet i synset-tabellen.

För att slutligen hitta synonymerna för vart och ett av synseten i listan behöver du helt enkelt söka i avkänningstabellen efter andra ord-förnimmelsepar som delade samma synset.

Exempel:Ett av de 41 ord-sens-paren för ordet "bära" listas nedan:Om vi ​​slår upp definitionen för denna synsetid 202083512, hittar du "sända eller fungera som medium för överföring"

För att hitta alla synonymer för denna definition, skulle du sedan söka i avkänningstabellen efter samma synsetid 202083512. Detta ger synonymer:kanal, uppträda, förmedla, förmedla och överföra (obs:du måste gå med i ordtabellen till vänster för att få själva lemman)

Jag hoppas att detta hjälper dig att avmystifiera WordNet åt dig.. Jag tycker att det är ganska coolt...



  1. PostgreSQL-mod:Vad är "resjunk"?

  2. Ersätt NOT IN med LEFT JOIN i SQL-satsen

  3. Zombie PerfMon-räknare som aldrig dör!

  4. SQL Server-markörtyper - Vad är statiska markörer i SQL Server | SQL Server Tutorial / TSQL Tutorial