一、如何在Python中使用MongoDB数据库。
在Python中使用MongoDB的方法,其实和我们平时使用EXCEL的方法相类似。当使用EXCEL时会经历以下步骤:①对EXCEL进行命名;②在EXCEL中增加sheet工作簿;③输入数据;④对数据进行分析,以表格、图像等方式展现数据。
类似的,在使用MongoDB时也同样会经历相似的四步:①给数据库命名;②在文件下创建表单;③将数据放入数据库中;④展示数据库中的数据。
在进行以上的步骤之前,还需要完成两个准备工作:
1)要想使用MongoDB同样需要先引入第三方库,和引入Request的方法一样,首现输入:import pymongo
2)与MongoDB客户端进行连接,输入:client = pymongo.MongoClient('localhost',27017),其中localhost表示是在本地创建创建数据库,27017表示本地端口(如果将MongoDB部署在网络环境中,端口会有所改变)。
1.给数据库命名
输入的代码为:A1= client['A2'],其中A1为在Python中的变量名称,A2为对应放入MongoDB数据库中的名称,为了便于管理,通常将两者取同样的名称。如要爬取knewone的数据,可以将数据库命名为knewone,代码写为:knewone = client['knewone']。
2.在文件下创建表单
输入的代码为:B1= A1['B2'],这段代码可以理解为在刚才创建的文件下创建表单。其中B1为Python中的变量名称,B2为刚才创建文件的表单名称。同样的道理,为了方便,B1和B2的名称最好相同。为了与EXCEL进行类比,在写代码的过程中获得熟悉感,可以将代码写为sheet1 = knewone['sheet1']。
3.将数据放入数据库中
输入的代码为:B1.insert_one(data),其中B1为创建的表单,data为我们抓取的数据,insert() 函数用于将指定对象插入列表的指定位置。
insert()方法语法:list.insert(index, obj)
index -- 对象obj 需要插入的索引位置。
obj -- 要插入列表中的对象。
4.展示数据库中的数据
在之前Python学习笔记5中,已经安装了mongo插件,这个插件就是帮助我们直观地去观察所存储的数据。
就如使用EXCEL一样,我们通常会去筛选我们需要的数据和信息,在MongoDB中,常用的条件操作符有:
$gt: (>) 大于 -
$lt :(<) 小于 -
$gte :(>=) 大于等于 -
$lte :(<= ) 小于等于 -
lt表示less than
,gt表示greater than,e表示equal,n表示not。
通过以上条件操作符,便可从众多数据中筛选出我们所需要的信息。
二、实战
存储学习笔记3中所爬取的小猪短租相关数据,并从中筛选出价格小于等于300的数据。
1.导入pymongo第三方库
2.给数据库命名并创建表单
创建一个名字为xiaozhu_bj的数据库,并在数据库中创建一个名字为sheet1的表单。
3.插入数据
将抓取的data数据存入sheet1中。
在Pycharm右侧的Mongo Explorer中,选择xiaozhu_bj数据库中的sheet1表单,便能查看所有存储数据。
存入数据库中的数据如下:
4.筛选出价格小于等于300的数据
利用for循环,筛选出价格≤300的数据。
如果输出的数据为空的情况,原因是在之前爬取数据时,没有定义价格的数据类型,需要将价格数据定义为整数后,才能进行大小判定。
最终筛选出的数据结果如下:
完整代码如下:
总结:
1.在Python中使用MongoDB数据库,就犹如我们平常使用EXCEL,通常需要经历数据库命名、创建表单、数据存储、数据展示4步;
2.MongoDB中常见的条件操作符有:$gt(>) 、$lt :(<) 、$gte :(>=) 、$lte :(<= ) ;
3.需要注意的坑:在筛选数据时,需要先将爬取的数据定义为整数后,才能进行大小判定。