MongoDB简介

MongoDB是一个基于分布式文件存储的数据库。由C++语言编写，旨在为WEB应用提供可扩展的高性能数据存储解决方案，MongoDB是一个介于关系型数据库和非关系型数据库之间的产品，是非关系型数据库当中功能最丰富，最像关系型数据库的

MongoDB集群几种搭建方式

集群方式有三种：Replica Set（副本集）、Sharding（分片集）、Master-Slave（主从）三种方式
三种模式各有优劣，适用于不同的场合，属Replica set（副本集）应用最为广泛，主从模式现在用的较少，sharding模式最为完备，但配置维护较为复杂

Master/Slave（主从）
Master/Slave这种方式基本上不再推荐使用，只能从Master复制数据到Slave，并不提供高可用，一旦Master结点出故障就比较难处理，不推荐使用
Replica Set（副本集）
即常说的副本集，副本集的主要目标有几个：

高可用（主要目标）：当一个结点故障时自动切换到其他结点；
数据冗余（主要目标）：数据复制到n个结点上，增加数据安全性，同时为高可用提供基础；
功能隔离（次要目标）：使用不同的结点隔离某些有特殊需求的功能，比如使用一个结点进行OLAP运算（大规模资源占用），使用一个结点在远程做灾备（性能要求不如本地高），读写分离等等主节点举有读写权限，而从节点只有读权限；

Sharded Cluster(分片集)
即分片集，分片集的主要设计目标是：

水平扩展：当一台服务器满足不了需求的时候，我们可以选择垂直扩展（增加服务器硬件），它虽然简单，但很容易达到极限，并且面临成本高等明显缺点，成本更低的方式是使用n台服务器组成集群来满足系统需求，这就是分片集的主要设计目标；
缩短响应时间：因为可以把数据分散到多台服务器上，自然每台服务器的处理压力减小，处理时间就会缩短；
这里会出现一个问题：假设每台服务器出故障的机率是x%，那么n台服务器有一台出现故障的机率就是x% * n，如果不做高可用设计，集群出现故障的概率就会随机器数量成正比增长，这是不能接受的，已经有了解决高可用的方案，也就是复制集，所以MongoDB的分片集群要求每一个片都是复制集（当然测试环境也可以使用单结点，生产环境不推荐）
ReplicaSet集群部署传送门
 Sharding部署传送门

部署MongoDB

配置yum源

在/etc/yum.repos.d/目录下创建mongodb-org-4.2.repo文件，写入以下内容

[root@bash ~]# cat > /etc/yum.repos.d/mongodb-org-4.2.repo << EOF
[mongodb-org-4.2]
name=MongoDB Repository
baseurl=https://repo.mongodb.org/yum/redhat/$releasever/mongodb-org/4.2/x86_64/
gpgcheck=1
enabled=1
gpgkey=https://blog.mongodb.org/static/pgp/server-4.2.asc
EOF

安装MongoDB

# 安装mongodb
[root@bash ~]# yum install -y mongodb-org

#安装相关组件包
[root@bash ~]# yum install -y mongodb-org-4.2.2 mongodb-org-server-4.2.2 mongodb-org-shell-4.2.2 mongodb-org-mongos-4.2.2 mongodb-org-tools-4.2.2

#在 /etc/yum.conf 文件中添加配置，防止意外升级
[root@bash ~]# echo "exclude=mongodb-org,mongodb-org-server,mongodb-org-shell,mongodb-org-mongos,mongodb-org-tools" >>/etc/yum.conf

MongoDB配置文件

# 数据库路径
[root@bash ~]# cd /var/lib/mongo
#log路径
[root@bash ~]# cd /var/log/mongodb

#将mongodb相关目录授权给mongod用户
[root@bash ~]# chown -R mongod:mongod /var/lib/mongo
[root@bash ~]# chown -R mongod:mongod /var/log/mongodb

# MongoDB配置文件
[root@bash ~]# vim /etc/mongod.conf
# 外网连接需要绑定内网IP地址：
net:
  port: 27017
  bindIp: 0.0.0.0

# 解决大内存警告，关闭系统大内存，重启MongoDB就可以了，但是重启系统之后就不行了
echo "never" > /sys/kernel/mm/transparent_hugepage/enabled
echo "never" > /sys/kernel/mm/transparent_hugepage/defrag

启动MongoDB并配置

#启动
[root@bash ~]# systemctl start mongod
#添加到自启
[root@bash ~]# systemctl enable mongod
#重启
[root@bash ~]# systemctl restart mongod
#停止
[root@bash ~]# systemctl stop mongod
#使用MongoDB
mongo

安全性

# 创建管理员用户
[root@bash ~]# mongo
MongoDB shell version v4.2.8
connecting to: mongodb://127.0.0.1:27017/?compressors=disabled&gssapiServiceName=mongodb
...
> use admin
switched to db admin
> db.createUser({user:"admin",pwd:"123456",roles:["root"]})
Successfully added user: { "user" : "admin", "roles" : [ "root" ] }

# 开启认证
[root@bash ~]# vim /etc/mongod.conf
...
security:
  authorization: enabled
...
  
# 重启MongoDB
[root@bash ~]# systemctl restart mongod

# 登录MongoDB，两种方式
[root@bash ~]# mongo -uadmin -p123456
MongoDB shell version v4.2.8
connecting to: mongodb://127.0.0.1:27017/?compressors=disabled&gssapiServiceName=mongodb
...
> 

[root@bash ~]# mongo
MongoDB shell version v4.2.8
connecting to: mongodb://127.0.0.1:27017/?compressors=disabled&gssapiServiceName=mongodb
Implicit session: session { "id" : UUID("20f0fbea-63e8-4d10-9fa5-1d9d8121d055") }
MongoDB server version: 4.2.8
> use admin
switched to db admin
> db.auth('admin', '123456')
1
> 

# 添加数据库用户
> use test  // 跳转到需要添加用户的数据库
switched to db test
> db.createUser({
      user: 'fooadmin',  // 用户名
      pwd: '123456',  // 密码
      roles:[{
        role: 'readWrite',  // 角色
        db: 'test'  // 数据库名
      }]
     })
Successfully added user: {
	"user" : "fooadmin",
	"roles" : [
		{
			"role" : "readWrite",
			"db" : "test"
		}
	]
}

客户端工具

MongoDB的客户端工具有很多，上面没安装的MongoDB Compass就是其中之一，另外Navicat 15版本也有MongoDB的管理功能，这里我们使用的是一款免费的客户端工具Robo 3T（以前叫Robomongo）

首先下载客户端工具，下载地址：robomongo.org/download
下载完成后解压，双击robo3t.exe即可使用
之后创建一个到MongoDB的连接

MongoDB相关概念及操作

MongoDB是非关系型数据库当中最像关系型数据库的，所以我们通过它与关系型数据库的对比，来了解下它的概念

SQL概念	MongoDB概念	解释/说明
database	database	数据库
table	collection	数据库表/集合
row	document	数据记录行/文档
column	field	数据字段/域
index	index	索引
primary key	primary key	主键,MongoDB自动将_id字段设置为主键

数据库操作

创建数据库，使用use命令去创建数据库，当插入第一条数据时会创建数据库，例如创建一个test数据库

> use test
switched to db test
> db.article.insert({name:"MongoDB 教程"})
WriteResult({ "nInserted" : 1 })
> show dbs
admin   0.000GB
config  0.000GB
local   0.000GB
test    0.000GB

删除数据库，使用db对象中的dropDatabase()方法来删除

> db.dropDatabase()
{ "dropped" : "test", "ok" : 1 }
> show dbs
admin   0.000GB
config  0.000GB
local   0.000GB

集合操作

创建集合，使用db对象中的createCollection()方法来创建集合，例如创建一个article集合

> use test
switched to db test
> db.createCollection("article")
{ "ok" : 1 }
> show collections
article

删除集合，使用collection对象的drop()方法来删除集合，例如删除一个article集合

> db.article.drop()
true
> show collections
>

文档操作

上面的数据库和集合操作是在MongoDB的客户端中进行的，下面的文档操作都是在Robomongo中进行的
###插入文档

MongoDB通过collection对象的insert()方法向集合中插入文档，语法如下

db.collection.insert(document)

使用collection对象的insert()方法来插入文档，例如插入一个article文档

db.article.insert({title: 'MongoDB 教程', 
    description: 'MongoDB 是一个 Nosql 数据库',
    by: 'Andy',
    url: 'https://blog.mongodb.com/',
    tags: ['mongodb', 'database', 'NoSQL'],
    likes: 100
})

使用collection对象的find()方法可以获取文档，例如获取所有的article文档

db.article.find({})
{
    "_id" : ObjectId("5e9943661379a112845e4056"),
    "title" : "MongoDB 教程",
    "description" : "MongoDB 是一个 Nosql 数据库",
    "by" : "Andy",
    "url" : "https://blog.mongodb.com/",
    "tags" : [ 
        "mongodb", 
        "database", 
        "NoSQL"
    ],
    "likes" : 100.0
}

更新文档

MongoDB通过collection对象的update()来更新集合中的文档，语法如下

db.collection.update(
   <query>,
   <update>,
   {
     multi: <boolean>
   }
)
# query：修改的查询条件，类似于SQL中的WHERE部分
# update：更新属性的操作符，类似与SQL中的SET部分
# multi：设置为true时会更新所有符合条件的文档，默认为false只更新找到的第一条

将title为MongoDB 教程的所有文档的title修改为MongoDB

db.article.update({'title':'MongoDB 教程'},{$set:{'title':'MongoDB'}},{multi:true})

除了update()方法以外，save()方法可以用来替换已有文档，语法如下

db.collection.save(document)

将ObjectId为5e9943661379a112845e4056的文档的title改为MongoDB教程

db.article.save({
    "_id" : ObjectId("5e9943661379a112845e4056"),
    "title" : "MongoDB 教程",
    "description" : "MongoDB 是一个 Nosql 数据库",
    "by" : "Andy",
    "url" : "https://blog.mongodb.com/",
    "tags" : [ 
        "mongodb", 
        "database", 
        "NoSQL"
    ],
    "likes" : 100.0
})

删除文档

MongoDB通过collection对象的remove()方法来删除集合中的文档，语法如下

db.collection.remove(
   <query>,
   {
     justOne: <boolean>
   }
)
# query：删除的查询条件，类似于SQL中的WHERE部分
# justOne：设置为true只删除一条记录，默认为false删除所有记录

删除title为MongoDB 教程的所有文档

db.article.remove({'title':'MongoDB 教程'})

查询文档

MongoDB通过collection对象的find()方法来查询文档，语法如下

db.collection.find(query, projection)
# query：查询条件，类似于SQL中的WHERE部分
# projection：可选，使用投影操作符指定返回的键

查询article集合中的所有文档

db.article.find()
/* 1 */
{
    "_id" : ObjectId("5e994dcb1379a112845e4057"),
    "title" : "MongoDB 教程",
    "description" : "MongoDB 是一个 Nosql 数据库",
    "by" : "Andy",
    "url" : "https://blog.mongodb.com/",
    "tags" : [ 
        "mongodb", 
        "database", 
        "NoSQL"
    ],
    "likes" : 50.0
}

/* 2 */
{
    "_id" : ObjectId("5e994df51379a112845e4058"),
    "title" : "Elasticsearch 教程",
    "description" : "Elasticsearch 是一个搜索引擎",
    "by" : "Ruby",
    "url" : "https://blog.elastic.co/cn/",
    "tags" : [ 
        "elasticearch", 
        "database", 
        "NoSQL"
    ],
    "likes" : 100.0
}

/* 3 */
{
    "_id" : ObjectId("5e994e111379a112845e4059"),
    "title" : "Redis 教程",
    "description" : "Redis 是一个key-value数据库",
    "by" : "Andy",
    "url" : "https://redis.io/",
    "tags" : [ 
        "redis", 
        "database", 
        "NoSQL"
    ],
    "likes" : 150.0
}

MongoDB中的条件操作符，通过与SQL语句的对比来了解下

操作	格式	SQL中的类似语句
等于	{:}	where title = 'MongoDB 教程'
小于	{:{$lt:}}	where likes < 50
小于或等于	{:{$lte:}}	where likes <= 50
大于	{:{$gt:}}	where likes > 50
大于或等于}	{:{$gte:}}	where likes >= 50
不等于	{:{$ne:}}	where likes != 50

条件查询，查询title为MongoDB 教程的所有文档

db.article.find({'title':'MongoDB 教程'})

条件查询，查询likes大于50的所有文档

db.article.find({'likes':{$gt:50}})

AND条件可以通过在find()方法传入多个键，以逗号隔开来实现，例如查询title为MongoDB 教程并且by为Andy的所有文档

db.article.find({'title':'MongoDB 教程','by':'Andy'})

OR条件可以通过使用$or操作符实现，例如查询title为Redis 教程或MongoDB 教程的所有文档

db.article.find({$or:[{"title":"Redis 教程"},{"title": "MongoDB 教程"}]})

AND 和 OR条件的联合使用，例如查询likes大于50，并且title为Redis 教程或者"MongoDB 教程的所有文档

db.article.find({"likes": {$gt:50}, $or: [{"title": "Redis 教程"},{"title": "MongoDB 教程"}]})

其他操作

Limit与Skip操作

读取指定数量的文档，可以使用limit()方法，语法如下

db.collection.find().limit(NUMBER)

只查询article集合中的2条数据

db.article.find().limit(2)

跳过指定数量的文档来读取，可以使用skip()方法，语法如下

db.collection.find().limit(NUMBER).skip(NUMBER)

从第二条开始，查询article集合中的2条数据

db.article.find().limit(2).skip(1)

排序

在MongoDB中使用sort()方法对数据进行排序，sort()方法通过参数来指定排序的字段，并使用1和-1来指定排序方式，1为升序，-1为降序

db.collection.find().sort({KEY:1})

按article集合中文档的likes字段降序排列

db.article.find().sort({likes:-1})

索引

索引通常能够极大的提高查询的效率，如果没有索引，MongoDB在读取数据时必须扫描集合中的每个文件并选取那些符合查询条件的记录
MongoDB使用createIndex()方法来创建索引，语法如下

db.collection.createIndex(keys, options)
# background：建索引过程会阻塞其它数据库操作，设置为true表示后台创建，默认为false
# unique：设置为true表示创建唯一索引
# name：指定索引名称，如果没有指定会自动生成

给title和description字段创建索引，1表示升序索引，-1表示降序索引，指定以后台方式创建

db.article.createIndex({"title":1,"description":-1}, {background: true})

查看article集合中已经创建的索引

db.article.getIndexes()
/* 1 */
[
    {
        "v" : 2,
        "key" : {
            "_id" : 1
        },
        "name" : "_id_",
        "ns" : "test.article"
    },
    {
        "v" : 2,
        "key" : {
            "title" : 1.0,
            "description" : -1.0
        },
        "name" : "title_1_description_-1",
        "ns" : "test.article",
        "background" : true
    }
]

聚合

MongoDB中的聚合使用aggregate()方法，类似于SQL中的group by语句，语法如下

db.collection.aggregate(AGGREGATE_OPERATION)

聚合中常用操作符如下

操作符	描述
$sum	计算总和
$avg	计算平均值
$min	计算最小值
$max	计算最大值

根据by字段聚合文档并计算文档数量，类似与SQL中的count()函数

db.article.aggregate([{$group : {_id : "$by", sum_count : {$sum : 1}}}])
/* 1 */
{
    "_id" : "Andy",
    "sum_count" : 2.0
}

/* 2 */
{
    "_id" : "Ruby",
    "sum_count" : 1.0
}

根据by字段聚合文档并计算likes字段的平局值，类似与SQL中的avg()语句

db.article.aggregate([{$group : {_id : "$by", avg_likes : {$avg : "$likes"}}}])

/* 1 */
{
    "_id" : "Andy",
    "avg_likes" : 100.0
}

/* 2 */
{
    "_id" : "Ruby",
    "avg_likes" : 100.0
}

正则表达式

MongoDB使用$regex操作符来设置匹配字符串的正则表达式，可以用来模糊查询，类似于SQL中的like操作
例如查询title中包含教程的文档

db.article.find({title:{$regex:"教程"}})

不区分大小写的模糊查询，使用$options操作符

db.article.find({title:{$regex:"elasticsearch",$options:"$i"}})