sql >> Databasteknik >  >> NoSQL >> MongoDB

Hur man grupperar efter olika fält

Det var en tuff sådan!

Först den nakna lösningen:

db.test.aggregate([
 { "$match": { "user": "Hans" } },
 // duplicate each document: one for "age", the other for "childs"
 { $project: { age: "$age", childs: "$childs",
               data: {$literal: ["age", "childs"]}}},
 { $unwind: "$data" },
 // pivot data to something like { data: "age", value: "40" }
 { $project: { data: "$data",
               value: {$cond: [{$eq: ["$data", "age"]},
                               "$age", 
                               "$childs"]} }},
 // Group by data type, and count
 { $group: { _id: {data: "$data", value: "$value" }, 
             count: { $sum: 1 }, 
             value: {$first: "$value"} }},
 // aggregate values in an array for each independant (type,value) pair
 { $group: { _id: "$_id.data", values: { $push: { count: "$count", value: "$value" }} }} ,
 // project value to the correctly name field
 { $project: { result: {$cond: [{$eq: ["$_id", "age"]},
                               {age: "$values" }, 
                               {childs: "$values"}]} }},
 // group all data in the result array, and remove unneeded `_id` field 
 { $group: { _id: null, result: { $push: "$result" }}},
 { $project: { _id: 0, result: 1}}
])

Producerar:

{
    "result" : [
        {
            "age" : [
                {
                    "count" : 3,
                    "value" : "40"
                },
                {
                    "count" : 1,
                    "value" : "50"
                }
            ]
        },
        {
            "childs" : [
                {
                    "count" : 1,
                    "value" : "1"
                },
                {
                    "count" : 3,
                    "value" : "2"
                }
            ]
        }
    ]
}

Och nu, för några förklaringar:

En av de stora frågorna här är att varje inkommande dokument måste vara en del av två olika summor. Jag löste det genom att lägga till en bokstavlig array ["age", "childs"] till dina dokument och sedan avveckla dem med den arrayen. På så sätt kommer varje dokument att presenteras två gånger i det senare skedet.

När det är gjort, för att underlätta bearbetningen, ändrar jag datarepresentationen till något mycket mer hanterbart som { data: "age", value: "40" }

Följande steg kommer att utföra dataaggregeringen i sig. Upp till det tredje $project steg som mappar värdefälten till motsvarande age eller childs fältet.

De sista två stegen kommer helt enkelt att slå in de två dokumenten i ett, vilket tar bort det onödiga _id fältet.

Pfff!




  1. Hur räknar man alla unika värden i MONGODB?

  2. Fel avståndsberäkning med MongoDB

  3. Django serialisering till JSON-fel:'MetaDict'-objektet har inget attribut 'concrete_model'

  4. Azure DataBricks Stream foreach misslyckas med NotSerializableException