sql >> Databasteknik >  >> NoSQL >> MongoDB

Binning och tabulering (unik/count) i Mongo

Jag har precis provat det nya aggregeringsramverket som kommer att vara tillgängligt i MongoDB version 2.2 (2.2.0-rc0 har släppts), som borde ha högre prestanda än kartminskning eftersom det inte är beroende av Javascript.

indata:

{ "_id" : 1, "age" : 22.34, "gender" : "f" }
{ "_id" : 2, "age" : 23.9, "gender" : "f" }
{ "_id" : 3, "age" : 27.4, "gender" : "f" }
{ "_id" : 4, "age" : 26.9, "gender" : "m" }
{ "_id" : 5, "age" : 26, "gender" : "m" }

aggregeringskommando för kön:

db.collection.aggregate(
   {$project: {gender:1}},
   {$group: {
        _id: "$gender",
        count: {$sum: 1}
   }})

resultat:

{"result" : 
   [
     {"_id" : "m", "count" : 2},
     {"_id" : "f", "count" : 3}
   ],
   "ok" : 1
}

För att få åldrarna i papperskorgar:

db.collection.aggregate(
   {$project: {
        ageLowerBound: {$subtract:["$age", {$mod:["$age",2]}]}}
   },
   {$group: {
       _id:"$ageLowerBound", 
       count:{$sum:1}
   }
})

resultat:

{"result" : 
    [
       {"_id" : 26, "count" : 3},
       {"_id" : 22, "count" : 2}
    ],
    "ok" : 1
}


  1. E-postindexering med Cloudera Search och HBase

  2. Mongodb upsert uppdaterar endast valda fält, men infogar alla

  3. Mongo-aggregation med sidnumrerade data och totaler

  4. Bästa sättet att fråga alla dokument från en mongodb-samling på ett reaktivt sätt utan översvämning av RAM