第九章 使用分组、聚合和映射 --- 归并

大纲

  • 根据字段的值将文档分组;
  • 创建聚合流水线(aggregation pipeline)
  • 使用聚合流水线来操作结果
  • 创建包含reduce 和 finalize函数的映射-归并(map reduce)操作
  • 使用映射-归并将一组文档归并为特定形式
MongoDB的强大功能之一是,能够在服务端对文档的值执行复杂的操作,
以生成全新的数据集。这让您能够返回这样的数据集,
即它们基于存储于数据库中的文档,但格式截然不同。
这样做的优点是,可在服务器端完成处理, 而不用先将文档发送给客户端。
可以达到,可以在服务端生成不同格式的数据,以返回给客户端。

分组方法:group()语法如下:

group({key,reduce,initial,[keyf],[cond],finalize}

参数说明:

参数 值类型 描述
keys 文档对象 一个指定要根据哪些键进行分组的对象, 其属性为要用于分组的字段。例如,要根据文档的字段first和last进行分组,可使用{key:{first:1,last:1}}
cond query对象 可选参数,这是一个query对象,决定了初始结果集将包含哪些文档。如何要包含字段size的值大于5的文档,可使用{cond:{size:{$gt:5}}}
initial 文档对象 一个包含初始字段和初始值的初始group对象,用于在分组期间聚合数据。对于每组不同的键值,都将创建一个初始对象。最常见的情况是,使用一个计数器来跟踪与键值匹配的文档数。例如:{initial:{"count":0}}
reduce 函数 一个接受参数obj和prev的函数(短小精悍(obj,prev)),对于每个与查询匹配的文档,都执行这个函数。其中参数obj为当前文档,而prev是根据参数initial创建的对象。这让你能够根据obj来更新prev,如计数或累计。例如,要将计数递增,可使用{reduce:function(obj,prev){prev.count++}}.
finalize 函数 一个接受唯一参数obj的函数(function(obj)),这个参数是对与每个键值组合匹配的最后一个文档执行reduce函数得到的,对于每个键值组合,都将对其使用reduce函数得到的最终对象调用这相函数,然后以数组的方式返回结果。
keyf 可选,function 用于替代参数key,可以不指定其属性为分组字段的对象,而指定一个函数,这个函数返回一个用于分组的key对象。这让你能够使用函数动态地指定要根据哪些键进行分组。

集合方法

MongoDB的一大扰点是, 能够装数据库查询结果聚合成完全不同于原始集合的结构 。MongoDB 集合框架相当杰出,简化了使用一系列操作来处理数据,以生成非凡结果的流程;
MongoDB数据集合是它的一个提高性能的一个重要亮点,值的重点研究学习

理解方法aggregate()

语法如下:

 aggregate( operator, [operator], [....])

**注意在MongoDB 2.6+的版本后, 针对aggregate()的方法返回结构进行了调整, 即直接返回一个包含聚合结果的迭代器。如下代码:

results = myCollection.aggregate(....);
results.forEach(function(item){
....
};

aggregate()方法中使用的聚合运算符如下

运算符 描述
$project 通过重命名,添加或删除字段来重新定议文档。您还可以重新计算值以及添加子文档。例如,下面的示例包含字段title并排除字段name:{$project:{title:1,name:0}};下面的示例如将字段name重命名为title:{$project:{title:"$name"}},下面的示例添加新字段total并根据字段price和tax计算其值:{$project:{total:{$add:["$price","$tax"]}}}
$match 使用本书前面讨论的查询运算符过滤文档集,如{$match:{value:{$gt:50}}}
$limit 限制传递给聚合流水线中下一个阶段的文档数,如{$limit:5}
$skip 指定执行聚合流水线的下一个阶段前跳过多少个文档,如{$skip:0}
$unwind $unwind的值必须是数组字段的名称(必须在该数组字段名前加上$,这样它才会被视为字段名,而不是字符串)。$unwind对指定的数组进行分拆,为其中的每个值创建一个文档,如{$unwind:"$myArr"}, 注意在3.2+ 的版本后,$unwind的函数语法有了变化,如下文说明
$group 将文档分组并生成一组新文档,但流水线的下一个阶段使用。在$group中必须定义新文档的字段;还可对各组的文档应用分组表达式运算符,如将value字段的值相加:{$group:{set_id:"$so_id", total:{$num:"$value"}}}
$sort 将文档交给聚合流水线的下一个阶段前, 对它们进行排序。$sort指定包含属性field:<sort_order>的对象,其中<sort_order>为1(升序)或 -1(降序),如{$soft:{name:1,age:-1}}

aggregate() 方法的使用例子:

db.zipcodes.aggregate([
      {$group:{_id:{_id:"$_id",state:"$state"},pop:{$sum:"$pop"}}},
      {$group:{_id:"$_id.state",avgtotalPop:{$avg:"$pop"}}}
])
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,324评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,303评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,192评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,555评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,569评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,566评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,927评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,583评论 0 257
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,827评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,590评论 2 320
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,669评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,365评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,941评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,928评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,159评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,880评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,399评论 2 342

推荐阅读更多精彩内容