My Blog | 详情

一、NoSQL概述

NoSQL是Not Only SQL的缩写，指的是非关系型数据库，与传统的关系型数据库相对应，主要用于超大规模数据的存储。

与RDBMS相比，具有如下特点：

没有声明性查询语言
没有预定义模式
键值对存储
最终一致性
非结构化和不可预知的数据
CAP定理
高性能和可伸缩性

优点：高可扩展性；分布式计算；低成本；半结构化数据；关系简单。

缺点：没有标准化；查询功能有限；最终一致性没有ACID直观。

二、MongoDB概述

MongoDB是一个基于分布式文件存储的开源数据库系统，为Web应用提供可扩展的高性能数据存储解决方案。将数据存储为一个文档，数据结构由键值对组成。存储的数据与应用的数据，在格式上（JSON）高度一致。

主要特点：

面向文档存储，操作简单
可以设置任何属性的索引
支持丰富的查询表达式
允许在服务端执行脚本
支持各种编程语言
具有更高的扩展性
可以将负载分布在各个节点

mongodb文档地址

三、主要概念

1、数据库database

与RDBMS的概念相同。MongoDB的默认数据库为“db”，存储在data目录中。不同的数据库放置在不同的文件中。

数据库名称的限制：

不能是空字符串
不能包含空格、“.”、“/”、“\”、“$”、空字符等
应该全部小写
最长64个字节

保留的数据库名称：

admin，相当于一个root数据库，如果将用户添加到该数据库，那么该用户将自动获得所有数据库的权限
local，这个数据库不会被复制，可以用来存储仅限于本地单个服务器的任意集合
config，当Mongo用于分片设置时，该数据库在内部使用，用来保存分片的相关信息

2、集合collection

相当于RDBMS中“表”的概念。集合没有固定的结构，可以插入不同格式和类型的数据。数据库的信息存储在dbname.system命名空间下的特殊集合中。

集合名称的限制：

不能是空字符串
不能包含空字符，空字符表示集合名的结尾
不能以system开头，属于系统保留的前缀
不能包含保留字符

3、文档document

相当于RDBMS中“行”的概念。MongoDB的文档不需要设置相同的字段，并且相同字段不需要相同的数据类型。文档的数据结构采用BSON格式，和JSON基本相同，BSON是一种类json的二进制形式的存储格式。

使用文档时需要注意：

文档中的键值对是有序的
文档中的值可以是任意数据类型
区分类型和大小写
不能有重复的键
文档的键是字符串

4、字段field

相当于RDBMS中“列”的概念。

字段的常用类型：

String，字符串类型，在MongoDB中，UTF-8才是合法编码
Integer，整形数值
Boolean，布尔值
Double，双精度浮点值
Min/Max keys，将一个值与BSON（二进制的JSON）元素的最低值/最高值相比较
Arrays，将数组或列表或多个值存储为一个键
Timestamp，时间戳，记录文档修改或添加的具体时间
Object，用于内嵌文档
Null，用于创建空值
Symbol，符号，基本等同于字符串类型
Date，日期时间
Object ID，用于创建文档的ID
Binary Data，用于存储二进制数据
Code，代码类型，用于在文档中存储JavaScript代码
Regular expression，正则表达式类型，用于存储正则表达式

5、索引index

与RDBMS的概念相同。

6、主键primary key

自动将_id字段设置为主键。

7、表连接

不支持表连接，但可以通过嵌入文档的方式实现。

四、用法

1、安装

windows: 从官网下载并直接安装，设置path环境变量。

Linux: 参加下方安装与卸载mongodb

2、启动

直接启动：

mongod

或指定配置文件启动：

mongod --config /etc/mongodb.conf

3、操作数据库

创建数据库：

use DATABASE_NAME

如果数据库不存在，则创建数据库，否则切换到指定的数据库。

查看当前数据库：

db

查看所有数据库：

show dbs

删除当前数据库：

db.dropDatabase()

在删除之前应该使用db命令查看当前数据库名，或者使用use命令切换到要删除的数据库。

删除集合：

db.collection.drop()

4、操作文档

插入：

db.COLLECTION_NAME.insert(document)

如果集合不存在，MongoDB会自动创建该集合并插入文档。如果不指定_id字段，save方法与insert方法类似。如果指定_id字段，save方法会更新该_id的数据。

更新：

db.COLLECTION_NAME.update(query, update, {upsert:boolean, multi:boolean, writeConcern:document})

query，更新的查询条件，相对于sql的where语句
update，更新的对象和操作符，相对于sql的set语句
upsert，可选，如果要更新的记录不存在，是否插入新记录，true为插入，默认false为不插入
multi，可选，默认false为只更新第一条记录，如果为true，则全部更新
writeConcern，可选，表示抛出异常的级别

通过传入的文档替换已有的文档：

db.COLLECTION_NAME.save(document, {writeConcern:document})

删除：

db.COLLECTION_NAME.remove(query, {justOne:boolean, writeConcern:document})

query，可选，要删除的文档的满足条件
justOne，可选，如果为true，则只删除一个文档
writeConcern，可选，表示抛出异常的级别

如果不包含任何参数，则删除集合中的所有文档。建议在执行remove操作之前，先执行find命令来判断执行条件是否正确。

查询：

db.COLLECTION_NAME.find()

如果希望格式化查询的结果，可以使用pretty方法：

db.COLLECTION_NAME.find().pretty()

如果希望只返回一个文档：

db.COLLECTION_NAME.findOne()

在find方法中，传入多个键值对，每个键值对之间以逗号分隔，等价于SQL中的and条件：

db.COLLECTION_NAME.find({key1:value1, key2:value2})

在find方法中，使用关键字$or，等价于SQL中的or条件：

db.COLLECTION_NAME.find({$or:[{key1:value1, key2:value2}]})

在MongoDB中，有四种条件操作符，分别是$gt、$lt、$gte、$lte，对应SQL中的大于、小于、大于等于和小于等于。

db.COLLECTION_NAME.find({key: {$gt : value}})

还有一个条件操作符$type，用来判断字段的类型：

db.COLLECTION_NAME.find({key: {$type : typeid}})

使用limit方法，指定要读取的记录数量：

db.COLLECTION_NAME.find().limit(NUMBER)

使用skip方法，跳过指定数量的记录，参数默认为0：

db.COLLECTION_NAME.find().limit(NUMBER).skip(NUMBER)

使用sort方法，指定排序的字段，参数为1表示升序，-1表示降序，默认按照升序排列：

db.COLLECTION_NAME.find().sort({KEY:1})

使用aggregate方法，处理数据并返回计算后的数据结果：

db.COLLECTION_NAME.aggregate(AGGREGATE_OPERATION)

聚合操作包括：

$sum，计算求和
$avg，计算平均值
$min，获取最小值
$max，获取最大值
$push，插入值到一个数组中
$addToSet，插入值到一个数组中，但不创建副本
$first，根据排序获取第一个文档数据
$last，根据排序获取最后一个文档数据

在MongoDB中，可以使用聚合管道，将文档在一个管道处理完毕之后把结果传递给下一个管道处理。

常用的管道操作：

$project，修改输入文档的结构，可以用来重命名、增加或删除字段，也可以用来创建计算结果以及嵌套文档
$match，用于过滤数据，只输出符合条件的文档
$limit，用来限制聚合管道返回的文档数
$skip，在聚合管道中跳过指定数量的文档
$unwind，将文档中的某一个数组类型字段拆分成多条，每条包含数组中的一个值
$group，将集合中的文档分组，用于统计结果
$sort，将输入文档进行排序之后输出
$geoNear，输出接近某一地理位置的有序文档

索引是特殊的数据结构，存储在一个易于遍历读取的数据集合中，是对数据库表中的若干字段的值进行排序的一种结构。MongoDB还提供多个可选参数，用来限定索引的规则。

创建索引：

db.COLLECTION_NAME.ensureIndex({KEY:1})

5、数据库的备份和恢复

复制：将数据同步在多个服务器的过程。提供了数据的冗余备份，并在多个服务器上存储数据副本。允许从硬件故障和服务中断中恢复数据。复制至少需要两个节点，其中一个是主节点，负责处理客户端请求，其余都是从节点，负责复制主节点的数据。

分片：当存储海量数据时，一台机器不足以存储数据，也不足以提供可接受的读写量。可以通过在多台机器上分割数据，使得数据库系统能够存储和处理更多的数据。Shard用于存储实际的数据块，实际使用中一个shard server可以由几台机器组成。Config server存储整个ClusterMetadata，其中包括chunk信息。Query routers前端路由，客户端由此接入。

备份：在MongoDB中，可以使用mongodump命令来备份数据，该命令可以导出所有数据到指定目录。

mongodump -h dbhost -d dbname -o dbdirectory

恢复：在MongoDB中，可以使用mongorestore命令来恢复备份的数据。

mongorestore -h dbhost -d dbname --directoryperdb dbdirectory

6、数据库的监控

在安装部署并启动MongoDB服务后，必须了解运行情况，并查看其性能。

mongostat是MongoDB自带的状态检测工具。mongotop用来跟踪一个MongoDB实例，查看读写所花费的时间。这两个工具都位于MongoDB的安装目录的bin目录下。

Linux CentOS 下安装与卸载 MongoDB

一、安装

1、配置yum管理包

　　1）、在路径/etc/yum.repos.d/下创建文件mongodb-org-3.4.repo

　　cd /etc/yum.repos.d/

　　touch mongodb-org-3.4.repo

　　2）、在文件mongodb-org-3.4.repo中写入如下内容

　　[mongodb-org-3.4]

　　name=MongoDB Repository

　　baseurl=https://repo.mongodb.org/yum/redhat/$releasever/mongodb-org/3.4/x86_64/

　　gpgcheck=1

　　enable=1

　　gpgkey=https://www.mongodb.org/static/pgp/server-3.4.asc

2、安装mongodb（会安装mongodb-org包及其依赖包mongodb-org-server、mongodb-org-mongos、mongodb-org-shell、mongodb-org-tools）

　　数据库实例默认在/var/lib/mongo路径下，日志默认在/var/log/mongodb路径下，也可以通过修改/etc/mongod.conf文件的storage.dbPath和systemLog.path配置

　　yum install -y mongodb-org

3、开启mongodb服务

　　service mongod start

4、通过查看日志方式，验证服务开启成功，其中有一行为：[thread1] waiting for connections on port 27017

　　cat /var/log/mongodb/mongod.log

5、设置开机启动

　　chkconfig mongod on

6、停止mongodb服务

　　service mongod stop

7、重启mongodb服务

　　service mongod restart

二、卸载

1、停止服务

　　service mongod stop

2、删除安装的包

　　yum erase $(rpm -qa | grep mongodb-org)

3、删除数据及日志

　　rm -r /var/log/mongodb

　　rm -r /var/lib/mongo

导入导出：支持json格式和bson格式，bson即 binary json, 特殊的json文件。

linux下可以使用：mongorestore -d <db_name> <bson_folder>