本文实例讲述了python连接、操作mongodb数据库的方法。分享给大家供大家参考,具体如下:
数据库连接
- from pymongo import MongoClient
- import pandas as pd
- #建立MongoDB数据库连接
- client = MongoClient('162.23.167.36',27101)#或MongoClient("mongodb://162.23.167.36:27101/")
- #连接所需数据库,testDatabase为数据库名:
- db=client.testDatabase
- #连接所用集合,也就是我们通常所说的表,testTable为表名
- collection=db.testTable
-
查询前几条
- dataSet=collection.find().limit(3)
- for item in dataSet:
- print(item)
-
无条件查询全部
- dataSet=collection.find()
- for item in dataSet:
- print(item)
-
按AND条件查询全部
- #查询cpu使用率大于等于10且内存使用率大于等于10的所有字段数据
- dataSet=collection.find({"cpu":{"$gte":10},"mem":{"$gte":10}})
- for item in dataSet:
- print(item)
-
按AND条件查询指定字段数据
- #查询cpu使用率大于等于10且内存使用率大于等于10的数据,字段只显示did、ts、cpu、mem
- dataSet=collection.find({"cpu":{"$gte":10},"mem":{"$gte":10}}, {"did":1,"ts":1,"cpu":1,"mem":1})
- for item in dataSet:
- print(item)
- #查询cpu使用率等于0且内存使用率等于0的数据,字段只显示did、ts、cpu、mem
- dataSet=collection.find({"cpu":0,"mem":0}, {"did":1,"ts":1,"cpu":1,"mem":1})
- for item in dataSet:
- print(item)
-
按OR条件查询指定字段数据
- #查询cpu使用率大于等于10或者内存使用率大于等于10的数据,字段只显示did、ts、cpu、mem
- dataSet=collection.find({"$or":[{"cpu":{"$gte":10}},{"mem":{"$gte":10}}]}, {"did":1,"ts":1,"cpu":1,"mem":1})
- for item in dataSet:
- print(item)
- #查询cpu使用率等于10或者内存使用率等于10的数据,字段只显示did、ts、cpu、mem
- dataSet=collection.find({"$or":[{"cpu":10},{"mem":10}]}, {"did":1,"ts":1,"cpu":1,"mem":1})
- for item in dataSet:
- print(item)
-
mongodb的条件操作符
- # > - $gt
- # < - $lt
- # >= - $gte
- # <= - $lte
-
排序
- #单列升序排序查询,,1 为升序,-1为降序
- dataSet=collection.find().sort([("cpu",1)])
- for item in dataSet:
- print(item)
- #多列排序查询
- dataSet=collection.find().sort([('did',pymongo.ASCENDING),('cpu',pymongo.DESCENDING)])
- for item in dataSet:
- print(item)
-
查询结果写入excel
- #查询cpu使用率大于等于10且内存使用率大于等于10的数据,字段只显示did、ts、cpu、mem,查询结果写入excel
- import pandas as pd
- dataSet=collection.find({"cpu":{"$gte":10},"mem":{"$gte":10}}, {"did":1,"ts":1,"cpu":1,"mem":1})
- did,ts,cpu,mem=[],[],[],[]
- for item in dataSet:
- did.append(item["did"])
- ts.append(item["ts"])
- cpu.append(item["cpu"])
- mem.append(item["mem"])
- df=pd.DataFrame({"did":did,"ts":ts,"cpu":cpu,"mem":mem})
- df.to_excel("C:/Users/Desktop/设备cpu内存数据.xlsx")
-
跳行查询
- #下面表示跳过两条数据后读取数据
- dataSet=collection.find().skip(2)
- for item in dataSet:
- print(item)
-
去重
- #查询cpu使用率大于20、did不重复的数据
- dataSet=collection.distinct("did",{"cpu":{$gt:20}})
- for item in dataSet:
- print(item)
- #等同mysql的select distinct(did) from user where cpu>20
-
参考:
操作mongodb更详细说明https://www.jb51.net/article/169726.htm
更多关于Python相关内容感兴趣的读者可查看jb51专题:《Python常见数据库操作技巧汇总》、《Python数学运算技巧总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》
希望本文所述对大家Python程序设计有所帮助。