MAC(终端)快捷键、mongo_mongodb聚合(aggregation、mapReduce)

@JunQiu 2018-09-18T11:23:47.000000Z 字数 2415 阅读 1789

MAC(终端)快捷键、mongo_mongodb聚合(aggregation、mapReduce)

summary_2018/07 other mongodb

1、日常工作

1.1、解决trace-ad-roi服务mongo：3.1.0->3.1.1d的版本bug

1.2、MAC(终端)一些实用的快捷键

1.3、mongodb聚合

2、技术学习

2.1、解决trace-ad-roi服务mongo：3.1.0->3.1.1d的版本bug

服务报错：MongoError: database name must be a string
本地运行正常，3.1.0没有加dbname，可能是版本问题，查看线上docekr生成的image的mongo的版本为3.1.1
3.1.0的情况下：参数useNewUrlParser，url必须有dbname,client.db()可以为空，否则认证错误，但是在3.1.1中，可有没有dbname参数，但client.db()不能为空，居然版本不向下兼容。。。

### some Instructions
// 查看image中一些以来的版本
docker inspect <hash>  //没有，可以到container中npm list查看

1.2、MAC(终端)一些实用的快捷键

Ctrl + a  // 跳到行首
Ctrl + e  // 跳到行尾
Ctrl + d  // 删除一个字符，相当于通常的Delete键（命令行若无所有字符，则相当于exit；处理多行标准输入时也表示eof）
Ctrl + u  // 删除光标之前到行首的字符
Ctrl + k  // 删除光标之前到行尾的字符
Ctrl + l  // 清屏，相当于执行clear命令
Ctrl + 方向 //缩放界面程序
终端分屏：详见见tool_shell_iterm

2.3、mongodb 聚合

2.3.1、聚合管道：基于流水线方式的处理

管道表达式

# 聚合管道
# 聚合管道的优化
核心思想：让尽量少的数据到达后面的管道中
1、Projection Optimization
聚合管道可以确定它是否仅需要文档中的字段的子集来获得结果。如果是这样，管道将只使用那些必需的字段，减少通过管道的数据量。（减少字段）
2、Pipeline Sequence Optimization
// 尽早通过$match过滤掉不需要的文档，以减少处理的数据量，如：$sort+ $match
// $skip+ $limit：可以先进行limit，再进行skip
// $project+ $skip或$limit：先进行limit
// $skip + $skip
# 管道的限制
1、结果大小限制
aggregate命令可以返回游标或将结果存储在集合中。返回游标或将结果存储在集合中时，结果集中的每个文档都受限制，目前为16兆字节; 如果任何单个文档超出 限制，该命令将产生错误。该限制仅适用于返回文档; 在管道处理期间，文档可能超过此大小。
在版本3.6中更改： MongoDB 3.6删除了aggregate 命令的选项，以将其结果作为单个文档返回。
2、内存限制
在2.6版中更改：
管道阶段的RAM限制为100兆字节。如果某个阶段超出此限制，MongoDB将产生错误。要允许处理大型数据集，请使用该allowDiskUse选项启用聚合管道阶段以将数据写入临时文件。
3.4中更改：
The $graphLookup stage must stay within the 100 megabyte memory limit. If allowDiskUse: true is specified for the aggregate() operation, the $graphLookup stage ignores the option. If there are other stages in the aggregate() operation, allowDiskUse: true option is in effect for these other stages.（allowDiskUse: true会被忽略在 in $graphLookup（递归搜索） stage）
# 聚合管道和分片:聚合管道支持在业务分片集合
3.2更改：
如果管道以分片$match键上的精确开头，则整个管道仅在匹配的分片上运行。以前，管道将被拆分，合并它的工作必须在主分片上完成。
（暂时不过多了解。。。。。）

2.3.2、Map-Reduce

Map-reduce是一种数据处理范例，用于将大量数据压缩为有用的聚合结果。
函数详解与参数

# map:映射并提交一个键值对
# reduce:一个键的所有值合并到一个单独的数组中
# Example
集合：
{
   "post_text": "tutorialspoint is an awesome website for tutorials",
   "user_name": "mark",
   "status":"active"
}
//mapreduce
>db.posts.mapReduce( 
   function() { emit(this.user_id,1); # 生成键值对}, 
   # values 数组形式 [1,2,3,4]
   # key:values {a:[1,2,3]}
   function(key, values) {return Array.sum(values)}, 
      {  
         query:{status:"active"},  
         out:"post_total" 
      }
)
结果：
{
   "result" : "post_total",
   "timeMillis" : 9,
   "counts" : {
      "input" : 4,
      "emit" : 4,
      "reduce" : 2,
      "output" : 2
   },
   "ok" : 1,
}
只有 4 个文档符合查询条件（status:"active"），于是 map 函数就生成了 4 个带有键值对的文档，而最终 reduce 函数将具有相同键值的映射文档变为了 2 个。
//查看查询结果使用find（）：
{ "_id" : "tom", "value" : 2 }
{ "_id" : "mark", "value" : 2 }
（暂时不过多了解。。。。。）

MAC(终端)快捷键、mongo_mongodb聚合(aggregation、mapReduce)

1、日常工作

1.1、解决trace-ad-roi服务mongo：3.1.0->3.1.1d的版本bug

1.2、MAC(终端)一些实用的快捷键

1.3、mongodb聚合

2、技术学习

2.1、解决trace-ad-roi服务mongo：3.1.0->3.1.1d的版本bug

1.2、MAC(终端)一些实用的快捷键

2.3、mongodb 聚合

2.3.1、聚合管道：基于流水线方式的处理

2.3.2、Map-Reduce

内容目录

选择主题