{ allowDiskUse: true }
Bör placeras direkt efter aggregationsrörledningen.
I din kod bör detta se ut så här:
db.getCollection('RAW_COLLECTION').aggregate([
// Group on unique value storing _id values to array and count
{ "$group": {
"_id": { RegisterNumber: "$RegisterNumber", Region: "$Region" },
"ids": { "$push": "$_id" },
"count": { "$sum": 1 }
}},
// Only return things that matched more than once. i.e a duplicate
{ "$match": { "count": { "$gt": 1 } } }
], { allowDiskUse: true } )
Obs:Använd { allowDiskUse: true }
kan introducera problem relaterade till prestanda eftersom aggregeringspipeline kommer åt data från temporära filer på disken. Beror också på diskens prestanda och storleken på din arbetsuppsättning. Testa prestanda för ditt användningsfall