Kopiera båda samlingarna till en enda samling (inkludera ett diskrimineringsfält om det behövs så att du kan se vilken typ av dokument du har i varje instans).
Kör map-reduce på den samlingen
I Map, avge ordet som nyckel och ett värde, säg {instance:1, dict:0}
eller {instance:0, dict:1}
beroende på om dokumentet som mappas är en instans eller en ordbokspost. (Du kan lägga till fler fält här i värdena efter behov.)
I Minska samlar du poängen (som vanligt).
Gör nu en fråga och letar efter instance > 0
och dict > 0
och du har alla ord som finns i båda.