MongoDB学习笔记

  |  
 阅读次数

MongoDB学习笔记(JS胖)

(2018年1月26日 13:53:11)

第01节:认识和安装MongoDB

MongoDB是非关系型数据库
关系数据库,是建立在关系模型基础上的数据库。
安装步骤:
1.去官网下载MongoDB,https://www.mongodb.com/,在网站中找到Download按钮。下载会有点忙,国外的服务器,你懂的。
2.下载后进行安装,安装没什么难度,但是对于新手建议选择默认安装,而不选择自己配置。等我们完全熟悉后再定制式配置。
3.安装时如果有安全软件,会报一些拦截,一律允许就好,不允许会安装失败的。
4.安装完成后,需要配置“环境变量”,目的是再命令行中直接使用,而不需要输入很长的路径了。(此步骤观看视频)

查看存在数据库命令:show dbs
查看数据库版本命令:db.version()

第02节:Mongo基本命令-1(show dbs use xxdb show collections db MongoDB的存储结构)

接下来的几节直接上手Mongo命令,MSSQLMYsql用的都是Sql命令
MongoDB的操作命令就是前端最熟悉的JavaScript命令。
先来一个常用的赋值和输出命令,熟悉一下。(操作前你需要打开Mongo服务器和链接到服务器-也就是我们上节讲的mongod命令和mongo命令)在命令行中输入以下代码。
需要注意的是这里的输出不再使用console.log(‘巴拉巴拉’),而是使用print(‘巴拉巴拉’),这个稍有区别。

MongoDB的存储结构
以前我们的关系型数据库的数据结构都是顶层是库,库下面是表,表下面是数据。但是MongoDB有所不同,库下面是集合,集合下面是文件,可以看下面这张图进行了解一下。

**存储解构不同**
  关系型数据库
    --数据库
    --数据表
    --数据行
  非关系型数据库(MongoDB)
    --数据库
    --集合
    --文件

 在学习中我们可以对比记忆,这样才能更好的了解这些名词,其实数据表就是集合,数据行就是文件,当然这只是为了记忆,实质还是有区别的。

基础Shell命令
了解存储结构后,就可学习基础Shell命令,因 命令 较基础,以 列表形式展现,具体使用方法可到视频观看。
show dbs:显示已有数据库. 如果你刚安装好,会默认有local、admin(config),这是MongoDB的默认数据库,我们在新建库时是不允许起这些名称的。
use admin: 进入数据,也可以理解成为使用数据库。成功会显示:switched to db admin
show collections: 显示数据库中的集合(关系型中叫,我们要逐渐熟悉)。
db:显示当前位置. 也就是你当前使用的数据库名称,这个命令算是最常用的,因为你在作任何操作的时候都要先查看一下自己所在的库,以免造成操作错误。

总结:这节 学习已经 进入 MongoDB 世界,使用 比较简单,都是 基本命令, 敲回车就可使用,但还要多进行 练习。重点 要转变 以前数据库存储结构的思想,掌握MongoDB的存储结构

第03节:Mongo基本命令-2(“基本数据增删改查use db insert find findOne update remove drop dropDatabase count)

学会基本的 数据 增删改查
数据操作基础命令:
use db(建立数据库):use不仅可以进入一个数据库,如果你敲入的库不存在,它还可以帮你建立一个库。但是在没有集合前,它还是默认为空。
db.集合.insert({"":"","":""}):新建数据集合和插入文件(数据),当集合没有时,这时候就可以新建一个集合,并向里边插入数据。 Demo:db.user.insert({“name”:”jspang”})
db.集合.find( ):查询所有数据,这条命令会列出集合下的所有数据,可以看到MongoDB是自动给我们加入了索引值的。Demo:db.user.find()
db.集合.findOne( ):查询第一个文件数据,这里需要注意的,所有MongoDB的组合单词都使用首字母小写的驼峰式写法。
db.集合.update({查询},{修改}):修改文件数据,第一个是查询条件,第二个是要修改成的值。这里注意的是可以多加文件数据项的,比如下面的例子。
db.集合.remove(条件):删除文件数据,注意的是要跟一个条件。Demo:db.user.remove({“name”:”jspang”})
以下基本不用
db.集合.drop( ):删除整个集合,这个在实际工作中一定要谨慎使用,如果是程序,一定要二次确认。
db.dropDatabase( ):删除整个数据库,在删除库时,一定要先进入数据库,然后再删除。实际工作中这个基本不用,实际工作可定需要保留数据和痕迹的。
db.collections.count({rule})

第04节:用js文件写mongo命令(var db = connect("dbName") )

命令行写mongo命令(shell)实在麻烦(无法忍受windows系统 命令行),这节学习用JS文件来写shell命令执行JSmongoShell命令大部分是相同的,只有小部分不一样。
把命令写入JS中
现模拟一个用户登录日志表 信息,用JS进行编写。在一个新建目录下,比如D:/mongoShell/,新建一个goTask.js文件。文件内容如下:

goTask.js文件
var userName=”jspang”; //声明一个登录名
var timeStamp=Date.parse(new Date()); //声明登录时的时间戳
var jsonDdatabase={“loginUnser”:userName,”loginTime”:timeStamp}; //组成JSON字符串
var db = connect(‘log’); //链接数据库
db.login.insert(jsonDdatabase); //插入数据

print(‘[demo]log print success’); //没有错误显示成功
var userName=”jspang”; //声明一个登录名
var timeStamp=Date.parse(new Date()); //声明登录时的时间戳
var jsonDdatabase={“loginUnser”:userName,”loginTime”:timeStamp}; //组成JSON字符串
var db = connect(‘log’); //链接数据库
db.login.insert(jsonDdatabase); //插入数据

print(‘[demo]log print success’); //没有错误显示成功

执行JS文件

mongo goTask.js

总结:这节很好的解决 在终端写 命令行 的难题,虽然大部分Shell和在命令行中写法一样,但是也稍有不同,希望小伙伴们可以轻松掌握。

第05节:批量插入的正确方法(“批量数据插入 以数组方式” 老版本MongoDB batchInsert 一次插入不要超 48M 静态存储 批量插入性能测试 批量>循环 数据库性能)

在操作数据库时要注意两个能力:
第一个是快速存储能力
第二个是方便迅速查询能力

批量插入
批量数据插入是以数组的方式进行的(如果写错,可以3个回车可以切出来)。我们现在命令行中敲入下面的代码,我们可以看到数据顺利插入了。
老版本MongoDB(3.2以前的版本基本都需要)是需要在Insert前加一个batch单词的,如下代码。
db.test.batchInsert()
注意一次插入不要超过48M,.zip大图片之类尽量用静态存储,MongoDB存储静态路径就好,这也算是一个规则。

批量插入性能测试
刚学了批量插入,那是循环插入快?还是批量插入快那?在一般人的认知里肯定是批量插入更快(其实这毋庸置疑),但我们要拿出极客精神,探个究竟,试着写一个小Shell,来验证一下结果。
先写一个循环插入方法:

`批量插入`代码:

总结:在工作中一定照顾数据库性能,这也是你水平的体现,一个技术会了很简单,但是要精通不那么简单。学完这节,记得在工作中如果在循环插入和批量插入举棋不定,那就选批量插入吧,它会给我们更优的性能体验。

第06节:修改:Update常见错误(只update修改项)

这节开始说一说Update 详细操作,先来看下常见错误,知道 困难 或者说 问题在哪里,再提出解决方案。这节会先演示一些错误的 Update 方法,然后再说正确的方法。希望不要误导小伙伴。
错误:只update修改项
Update的使用方法需要注意
db.xxxset.update({“”:””},{"":""} || [] || variable)(此方法属于整条数据修改,替换项需要整条数据)

正确修改方法
可以声明一个变量,然后把要改变数据的全部信息放入变量,最后执行修改操作。

现在这种方法才是正确的,数据修改正常了,但是你会发现写起来非常麻烦,而且特别容易写错。下节我们会介绍update修改器,可以很好的解决这个问题。

第07节:修改:初识update修改器($set/$set嵌套内容 $unset $inc multi upsert)

上节的修改用起来实在是不够优雅,这是我们一个伟大的前端不能接受的,所以我们要学习update修改器,来解决这个问题。update修改器可以帮助我们快速简单的修改数据,让我们的操作更简单方便。
$set修改器
用来修改一个指定的键值(key),这时候我们要修改上节的sex和age就非常方便了,只要一句话就可以搞定。

db.workmate.update({“name”:”MinJie”},{“$set”:{sex:2,age:21}})
修改好后,我们可以用db.workmate.find()来进行查看,你会发现数据已经被修改。
修改嵌套内容(内嵌文档)
db.workmate.update({“name”:”MinJie”},{“$set”:{“skill.skillThree”:’word’}})

$unset用于将key删除

db.workmate.update({“name”:”MinJie”},{$unset:{“age”:’’}})

$inc对数字进行计算
它是对value值的修改,但是修改的必须是数字,字符串不起效果的。

db.workmate.update({“name”:”MinJie”},{$inc:{“age”:-2}})

multi选项
multi是有turefalse两个值,true代表全部修改,false代表只修改一个(默认值)

upsert选项
upsert也有turefalse两个值:true代表没有就添加,false代表没有不添加(默认值)

总结:这节的内容非常多,主要学习了update修改器有关的一些东西。一定要多练习几遍,否则很快就会忘记的。

第08节:修改:update数组修改器($push $ne $addToSet $each $pop)

已学会一些基础修改器,这节主要学习数组修改器的操作,也可修改内嵌文档,也就是对象形式的数据
$push追加数组/内嵌文档值
$push的功能是追加数组中的值,但我们也经常用它操作内嵌文档,就是{}对象型的值。
先看一个追加数组值的方式,比如我们要给小王加上一个爱好(interset)为画画(draw):

db.workmate.update({name:’xiaoWang’},{$push:{interest:’draw’}})
当然$push修饰符还可以为内嵌文档增加值.
比如我们现在要给我们的UI,增加一项新的技能skillFour为draw,这时候我们可以操作为:
db.workmate.update({name:’MinJie’},{$push:{“skill.skillFour”:’draw’}})
$push修饰符在工作中是最常用的,因为 数据一般都会涉及数组内嵌文档的操作,一定要掌握。

$ne查找是否存在(类似 if(xxx === undefined || !xxx)/else 判断)
它主要的作用是,检查一个值是否存在,如不存在再 执行操作,存在就不执行,这个很容易弄反,记得我刚学的时候就经常弄反这个修改器的作用,给自己增加了很多坑。

db.workmate.update({name:’xiaoWang’,”interest”:{$ne:’playGame’}},{$push:{interest:’Game’}})
总结:没有则修改,有则不修改。

$addToSet 升级版的$ne
它是$ne的升级版本(查找是否存在,不存在就push上去),操作起来更直观和方便,所以再工作中这个要比$en用的多。

db.workmate.update({name:”xiaoWang”},{$addToSet:{interest:”readBook”}})

$each 批量追加
它可以传入一个数组,一次增加多个值进去,相当于批量操作,性能同样比循环操作要好很多,这个是需要我们注意的,工作中也要先组合成数组,然后用批量的形式进行操作。

var newInterset=[“Sing”,”Dance”,”Code”];
db.workmate.update({name:”xiaoWang”},{$addToSet:{interest:{$each:newInterset}}})

$pop 删除数组值
$pop只删除一次,并不是删除所有数组中的值。而且它有两个选项,1-1
1:从数组末端进行删除
-1:从数组开端进行删除

db.workmate.update({name:’xiaoWang’},{$pop:{interest:1}})

数组定位修改
有时候只知道修改数组的第几位,但并不知道是什么,这时候我们可以使用interest.int的形式。
例子 比如我们现在要修改xiaoWang的第三个兴趣为编码(Code),注意这里的计数是从0开始的。

db.workmate.update({name:’xiaoWang’},{$set:{“interest.2”:”Code”}})

总结:这节主讲数组内嵌文档有关的update修改器,内容很多,都需要不断熟练记忆。当然如果你记不住,你至少记住这个博客网址,因为技术胖把笔记已经给你整理好了。

第09节:修改:状态返回与安全(应答式/非应答式 db.runCommand() findAndModify())

在操作数据库时,对数据的修改需要足够的安全措施,实际工作中,用db.collections.update不多,修改时都用findAndModify,它返回来一些必要的参数,让我们对修改多了很多控制力,控制力的加强也就是对安全的强化能力加强

应答式写入
先了解一个概念:应答式写入。在以前的文章中,我们的操作都是非应答式写入,就是在操作完数据库后,它并没有给我们任何的回应返回值,而是我们自己安慰自己写了一句话(print(‘[update]:The data was updated successfully’);)。这在工作中 不允许,因为根本不能提现我们修改的结果
应答式写入就会给我们直接返回结果(报表),结果里边的包含项会很多,这样我们就可以很好的进行程序的控制和安全机制的处理。有点像前端调用后端接口,无论作什么,后端都要给我一些状态字节一样。

db.runCommand()
是数据库运行命令的执行器,执行命令首选就要使用它,因为它在Shell驱动程序间提供了一致的接口。(几乎操作数据库的所有操作,都可以使用runCommand来执行)现在我们试着用runCommand来修改数据库,看看结果和直接用db.collections.update有什么不同

db.workmate.update({sex:1},{$set:{money:1000}},false,true)
var resultMessage=db.runCommand({getLastError:1})
printjson(resultMessage);

上边代码 修改所有男士 每人增加1000元钱(money),然后用db.runCommand()执行,可看到执行结果在控制台返回。
{
“connectionId” : 1,
“updatedExisting” : true,
“n” : 2,
“syncMillis” : 0,
“writtenTo” : null,
“err” : null,
“ok” : 1
}
false:第一句末尾的false是upsert的简写,代表没有此条数据时不增加;
true:true是multi的简写,代表修改所有,这两个前边已学过。
getLastError:1 :表示返回功能错误,这里的参数很多,如果有兴趣请自行查找学习,这里不作过多介绍。
printjson:表示以json对象的格式输出到控制台。
db.listCommands( ):查看所有的Commad命令, 内容很多, 本课程只讲解工作中经常使用的内容。

比如我们要查看是否和数据库链接成功了,就可以使用Command命令。
db.runCommand({ping:1})
返回ok:1就代表链接正常。

findAndModify
从名字看,findAndModify查找并修改的意思。配置它可以在修改后给我们返回修改的结果。看下面代码:

var myModify={
findAndModify:”workmate”,
query:{name:’JSPang’},
update:{$set:{age:18}},
new:true //更新完成,需要查看结果,如果为false不进行查看结果
}
var ResultMessage=db.runCommand(myModify);

printjson(ResultMessage)
findAndModify性能是不如db.collections.update的性能好,但实际工作中都使用它,毕竟要商用程序安全性还是比较重要的。
findAndModify属性值:
query:需要查询的条件/文档
sort: 排序
remove:[boolean]是否删除查找到的文档,值填写true,可以删除。
new:[boolean]返回更新前的文档还是更新后的文档。
fields:需要返回的字段
upsert:没有这个值是否增加。
总结:这节讲了一些跟安全有关的操作,但这不是全部,我们随着课程的深入还会继续学习更多的知识。工作中尽量使用findAndModify来进行更新数据,这样会更安全和直观,这点性能的损失是值得的。

第10节:查询:find的不等修饰符(简单查找("x.x")转字符串 筛选字段(第二对象参数 boolean || 0/1) 不等修饰符)

MongoDB查找操作 分几节课来讲,因为内容比较多, 开发中 查找 是应用最多的操作,几乎每个模块都会用到,所以查找部分将是本套课的重中之重。这节课我们先来看看简单的查询条件,也了解一下find基础用法。
如果你以前操作过关系型数据库比如MySql 你会对>(大于),<(小于),=(等于)这些东西很熟悉,但是非关系型数据库不能直接使用这些符号,稍有区别。
构造数据
我们需要构造更多的数据到集合中,这样我们才能很好的讲解查询条件,下面代码你可以直接复制进行添加。当然你也可以自己随意加一些数据到集合中,只要方便我们学习就可以了。
“D:\工具\工作学习\monggoShell\demo10.js”

简单查找
比如 现在要查找数据中 技能一 会HTML+CSS 的所有人。直接进行查找加条件就可以。

db.workmate.find({“skill.skillOne”:”HTML+CSS”})
这时不能使用load来载入,以后会给大家讲使用方法,先用比较笨的方法,使用粘贴复制的方法 在命令行执行。

筛选字段
返回数据项太多,太乱,有时 程序并不需要 这么多选项。比如 只需要姓名技能就可以了。这时候需要写第二个参数,看以下代码。
db.workmate.find(
{“skill.skillOne”:”HTML+CSS”},
{name:true,”skill.skillOne”:true}
)
终端中看到如下结果:
略……
细心的小伙伴会发现还不够完美,多了一个ID字段,这个也不是我们想要的,这时候只要把_id:false就可以了。当然这里的falsetrue,也可以用01表示。
db.workmate.find(
{“skill.skillOne”:”HTML+CSS”},
{name:1,”skill.skillOne”:1,_id:0}
)
不过这些查找操作,都是在作等于的阶段,但是不光只有等于查询,我们需要更多的查询条件。

不等修饰符

  • 小于($lt):英文全称less-than
  • 小于等于($lte):英文全称less-than-equal
  • 大于($gt):英文全称greater-than
  • 大于等于($gte):英文全称greater-than-equal
  • 不等于($ne):英文全称not-equal
    现在要查找,公司内年龄小于30&大于25岁的人员。看下面的代码。
    db.workmate.find(
    {age:{$lte:30,$gte:25}},
    {name:true,age:true,”skill.skillOne”:true,_id:false}
    )

    日期查找
    MongoDB也提供了方便的日期查找方法,现在我们要查找注册日期大于2018年1月10日的数据,我们可以这样写代码。
    “D:\工具\工作学习\monggoShell\batch10.js”
    先声明一个日期变量,然后使用大于符($gt)进行筛选。

    总结:这节课内容并不多,但如果你是个DBA(数据库管理员) 查找命令工作中每天都会用到,所以这节课的内容练习是必须的,如果你懒得动手,那接下来的课程你可能无法学会。

第11节:查询:find的多条件查询($in/$nin(有/无) $or / $and / $not(或/与/非))

很多时候我们需要查询的值不只是有一个简单的条件,比如我们现在要查询一下同事中是33岁25岁的,还比如我们要查询同事中大于30岁并且会PHP技能的。MongoDB在这方面也支持的很好,我们来学习一下。

$in修饰符
in修饰符可以轻松解决一键多值的查询情况。
就如上面我们讲的例子,现在要查询同事中年龄是25岁和33岁的信息。

db.workmate.find(
{age:{$in:[25,33]}},
{name:1,”skill.skillOne”:1,age:1,_id:0}
)
$in相对的修饰符是$nin,就是查询除了$in条件以外的值,小伙伴们可以自己进行练习一下,这里我就不作过多的演示了。

$or修饰符
$or修饰符用来查询多个键值的情况,比如查询同事中大于30岁或者会做PHP的信息。
$or修饰符$in/$nin主要区别 $or修饰符是两个Key值 $in/$nin修饰符是一个Key值 需比较记忆。

总结:这节知识比较简单,但要区分记忆,很容易搞混。幸运的是这里已经为你准备好学习笔记。当你忘记的时候过来看看吧。

第12节:查询:find的数组查询($all $in $size $slice(显示选项))

这节主要学习数组的查询,在学习update时就花了重墨去讲数组的操作,可见数组的操作在MongoDB中很受重视,因为稍微大型一点的项目,设计的数据集合都复杂一些,都会涉及数组的操作。

完善数据
以前我们的workmate集合对数组涉及还很少,现在在数据中加入了兴趣(interest),并且给每个人加入了一些兴趣,比如有写代码,做饭,看电影…
当然这些数据你可以自己随意构建,但是如果你不想自己费事费脑,这里也为你准备好了数据,你只要把以前的表删除(drop)掉,重新载入(load)就可以了。

基本数组查询
比如现在我们知道了一个人的爱好是’画画’,’聚会’,’看电影’,但我们不知道是谁,这时候我们就可以使用最简单的数组查询(实际工作中,这种情况基本不常用,所以这种查询只作知识点储备就可以了)。

在终端中运行后,我们得到了数据。这时候我们说,想查出看兴趣中有看电影的员工信息。按照正常逻辑,应该使用下面的代码。

$all-数组多项查询(类似 &&)
现在我们的条件升级了,要查询出既喜欢看电影看书的人员信息,也就是对数组中的对象进行查询,这时候要用到一个新的查询修饰符$all。看下面的例子:

$in-数组的或者查询
$all修饰符,需要满足所有条件; $in主要满足数组中任意的一项就可以被查出来(有时候会跟$or弄混)。比如现在要查询爱好中有看电影的或者看书的员工信息。

$size-数组个数查询

$slice-显示选项
展示数据时的判断条件,显示前几项或后几项。
db.workmate.find(
{},
{name:1,interest:{$slice:2},age:1,_id:0}
)

总结:如果你只看视频一定学不会,程序这东西必须要动手练习,我在所有的视频中都反复强调,目的没有别的就是想让你们真的学会,并应用到工作中去。

第13节:查询:find的参数使用方法(find参数[query,fields,limit,skip,sort] 分页Demo $where)

前边已讲3节查询,都是在操作find方法的第一个参数(query)第二个参数(fields)find还有几个常用的参数,这些参数多用在分页排序上。这节我们就把这些常用的选项说一说,理解后我们演示一个分页的效果。

find参数
query:这个就是查询条件,MongoDB默认的第一个参数。
fields:(返回内容)查询出来后显示的结果样式,可以用true(1)false(0)控制是否显示。
limit:返回的数量,后边跟数字(number),控制每次查询返回的结果数量。
skip:跳过多少个显示,和limit结合可以实现分页。(number)
sort:排序方式,从小到大排序使用1,从大到小排序使用-1

分页Demo

db.workmate.find({},{name:true,age:true,_id:false}).limit(0).skip(2).sort({age:1});

$where修饰符
db.workmate.find(
{$where:”this.age>30”},
{name:true,age:true,_id:false}
)
这里的this指向的是workmate(查询集合)本身。这样我们就可以在程序中随意调用。虽然强大和灵活,但是这种查询对于数据库压力安全性都会变重,所以在工作中尽量减少$where修饰符的使用。

第14节:查询:find如何在js文本中使用(hasNext forEach)[基础部分完结]

前边使用find都是JS在文本中写完,然后复制到终端中执行,这样非常麻烦。在讲的过程中已经有很多小伙伴在问我如何像写update语句一样,在文本中直接运行。这节课我们就学习一下如何直接在文本中执行。

hasNext循环结果
想在文本中执行我们的find语句要用到游标循环的操作,先看一下代码,代码中我已经对每一句进行了注释。

var db = connect(“company”) //进行链接对应的集合collections
var result = db.workmate.find() //声明变量result,并把查询结果赋值给result
//利用游标的hasNext()进行循环输出结果。
while(result.hasNext()){
printjson(result.next()) //用json格式打印结果
}
写完后,现在你只需要在终端中进行load()就可以执行了,再也不用麻烦的复制粘贴了。

forEach循环
利用hasNext循环结果,需要借助while的帮助,MongoDB也为我们提供了forEach循环,现在修改上边的代码,使用forEach循环来输出结果。

var db = connect(“company”) //进行链接对应的集合collections
var result = db.workmate.find() //声明变量result,并把查询结果赋值给result
//利用游标的hasNext()进行循环输出结果。
result.forEach(function(result){
printjson(result)
})
作者觉的forEach循环更为优雅。这两种方法都是非常不错的,凭借自己爱好进行选择吧。

总结:那我们MongoDB的基础部分就全部讲完了,我们学会了它的增、删、改、查,你也可以使用MongoDB进行一些操作了。需要注意的是,只是这篇文章的完结,下篇文章我们进行讲解MongoDB,开始讲解MongoDB的索引

第15节:索引:构造百万级数据(db.randomInfo.stats())

索引的性能体现必须要有大量数据才能看出来,你说你有10条20条数据,这是根本看不出来效果的,这节课就通过随机数的方法,创造出一个百万级数据的数据库出来。(随机插入数据,见mongoshell demo15.js)
PS:索引是什么?把数据当成一个字典,索引目录。消耗内存硬盘

制作随机数方法

制作随机用户名

插入完成后,我们可以使用db.randomInfo.stats()命令查看数据中的数据条数。

总结:这节课主要是为讲解MongoDB的索引作准备,我们用随机数的方法构建了一个百万级的数据表,如果你有兴趣继续往下学习 练习,这节课必须动手做一下。以后这篇文章的学习全是基于这个代码。

第16节:索引:索引入门(ensureIndex getIndexes)

集合中已建立 200万条数据,可以进行索引的操作了。我们先来建立一个索引,然后看看它的查询性能到底提升了多少倍。这节课的内容不会很难,主要掌握索引的建立方法即可。

建立索引

db.randomInfo.ensureIndex({username:1})

查看现有索引

db.randomInfo.getIndexes()   

第17节:索引:复合索引(复合索引的坑 ensureIndex hint)

什么样的数据使用索引会变慢?
复合索引使用语法
通过这节 需要对索引使用的时机有所了解,避免画蛇添足,产生不必的麻烦。

索引中的小坑

  • 数据不超万条时,不需要使用索引。性能的提升并不明显,大大增加了内存、硬盘 消耗
  • 查询数据超过表数据量30%时,不要使用索引字段查询。实际证明会比不使用索引更慢,因为它大量检索索引表和我们原表
  • 数字索引,要比字符串索引快的多,在百万级甚至千万级数据量面前,使用数字索引是个明确的选择。
  • 把你经常查询的数据做成一个内嵌数据(对象型的数据),然后集体进行索引。

复合索引(ensureIndex)

复合索引就是两条以上的索引。上节课我们已经把username字段建立了索引,我们现在把randNum0,这个字段也设置成索引。
db.randomInfo.ensureIndex({randNum0:1})

建立好后,再用查询索引状态命令进行查询。
db.randomInfo.getIndexes()

两个索引同时查询

var db = connect('company');
var rs= db.randomInfo.find({username:'7xwb8y3',randNum0:565509});

从性能上看并没有什么特殊的变化,查询时间还是在4ms左右。MongoDB的复合查询是按照我们的索引顺序进行查询的。就是我们用db.randomInfo.getIndexes()查询出的数组。

指定索引查询(hint)

数字的索引要比字符串的索引,这就需要一个方法来打破索引表的查询顺序,用我们自己指定的索引优先查询,这个方法就是hint().

var rs= db.randomInfo.find({username:'7xwb8y3',randNum0:565509}).hint({randNum0:1});

由于数据量复杂成都一般,所以没有明显性能提升。工作中遇到大数据,会得到好的效果

删除索引(dropIndex)

当索引性能不佳起不到作用时,我们需要删除索引,删除索引的命令是dropIndex().

db.randomInfo.dropIndex('randNum0_1'); // 索引的唯一ID

这里需要注意的是删除时填写的值,并不是 字段名称(key)而是 索引查询表(getIndexes())中 name值

总结:这节主要内容 操作索引,包括复合索引 建立/删除。使用 索引的 窍门

有时候需要在大篇幅文章搜索关键词,比如文章每篇都在万字以上,这时候想搜索关键字是非常不容易的,MongoDB为提供了全文索引

准备工作(建立集合 插入 数据)

先建立集合(collections) —— info,然后插入 小段文章,作用就是为 建立 全文索引 提供数据,不再建立 百万级数据,只看效果。

db.info.insert({contextInfo:"I am a programmer, I love life, love family. Every day after work, I write a diary."})
db.info.insert({contextInfo:"I am a programmer, I love PlayGame, love drink. Every day after work, I playGame and drink."})

再次强调 只是练习需要,实际工作中 简单数据 没必要 建立 全文索引。

建立全文索引(ensureIndex)

db.info.ensureIndex({contextInfo:'text'})

需要注意的是这里使用text关键词来代表全文索引,这里不再 建立数据模型

建立好了全文索引就可以查找了,查找时需要两个关键修饰符:

  • $text:表示要在全文索引中查东西。
  • $search:后边跟查找的内容。

    db.info.find({$text:{$search:”programmer”}})

多词查找(单词关系为 或||, 排除关键词-)

全文索引是支持多词查找的,比如我们希望查找数据中有programmer,family,diary,drink的数据(单词关系属于 或|| 的关系),所以两条数据都会出现。

db.info.find({$text:{$search:"programmer family diary drink"}})

如果不希望 查找带有drink这个单词的记录,我们可以使用-减号来排除。

db.info.find({$text:{$search:"programmer family diary -drink"}})

转义符()

全文搜索支持转义符,比如 想 搜索的是 两个词(love PlayGamedrink),这时候需要使用\反斜杠来转意。

db.info.find({$text:{$search:"\"love PlayGame\" drink"}})

总结

全文索引在工作中比较常用,比如博客文章搜索、长文件关键词搜索,都需要使用全文索引。

##