经验首页 前端设计 程序设计 Java相关 移动开发 数据库/运维 软件/图像 大数据/云计算 其他经验
当前位置:技术经验 » 数据库/运维 » MongoDB » 查看文章
MongoDB通过Shell 实现集合的日常归档
来源:cnblogs  作者:东山絮柳仔  时间:2019/4/15 8:55:33  对本文有异议

 1.MongoDB数据归档的意义

和其他类型的数据库一样,归档对MongoDB同样重要。通过归档,可以保持集合中合适的数据量,对数据库的性能是一种保障,也就是大家常说的数据冷热分离。

同时,归档对数据库的管理也带来了很大方便性,例如日常的备份、灾难恢复等。

在此,不再展开叙述了。

 2.集合数据归档流程图

3.归档实现代码

  1. #
  2. # The file is used by cron to Archive the data of NeedArchiveColName_Archive collection,the collection is part of NeedArchiveDBColName DB.
  3. # The file is writed by DBA Carson Xu.If you find any error, please connect with me,thanks.
  4. # The version is defined V.001
  5. # Version ModifyTime ModifyBy Desc
  6. # Ver001 2019-02-22 14:20 Carson Xu Create the Scripts File
  7. #
  8. #
  9. #!/bin/bash
  10. ######mongodb可执行文件所在文档路径,此例为4.04 ,同时支持3.4.4
  11. command_linebin="/QQMSG/mongo_db/mongobin404/bin/mongo"
  12. command_linebinT="/QQMSG/mongo_db/mongobin404/bin/mongo"
  13. ######存放导出过渡文件的文档路径和文件名字,ColA可用你的集合名字替代
  14. targetpath='/data/mongodb_back/ArchiveDB_端口号'
  15. bakcollectionname=NeedArchiveColName_$(date "+%Y%m%d%H%M")
  16. ###### 登入账号信息
  17. username="账号"
  18. password="账号密码"
  19. #######start 设置备份集合的开始日期和结束日期 #####
  20. ParamBakStartDate=$(date -d '-46 days' "+%Y-%m-%d")
  21. echo "备份NeedArchiveColName时间参数中的开始时间为:" $ParamBakStartDate
  22. ParamBakEndDate=$(date -d '-45 days' "+%Y-%m-%d")
  23. echo "备份NeedArchiveColName时间参数中的结束时间为:" $ParamBakEndDate
  24. ParamBakStartTimeS="$(date -d $ParamBakStartDate +%s)"
  25. ParamBakEndTimeS="$(date -d $ParamBakEndDate +%s)"
  26.  
  27. echo "备份集合的时间转换为UTC时间秒数为:" $ParamBakStartTimeS $ParamBakEndTimeS
  28. ParamBakStartTimeMS=$[$ParamBakStartTimeS * 1000+8*60*60*1000]
  29. ParamBakEndTimeMS=$[$ParamBakEndTimeS * 1000+8*60*60*1000]
  30. echo "备份集合的时间转换为UTC时间毫秒数为:" $ParamBakStartTimeMS $ParamBakEndTimeMS
  31. #######end ######
  32. ######## start 连接源Server DB ,检查此次集合备份的文档数
  33. command_line="${command_linebin} localhost:端口号/NeedArchiveDBColName -u$username -p$password"
  34. export docQty=$(/bin/echo 'db.NeedArchiveColName.find({NeedArchiveByField:{$gte:new Date('\"$ParamBakStartDate\"'),$lt:new Date('\"$ParamBakEndDate\"')}}).count()' | $command_line --quiet)
  35. echo "备份前集合NeedArchiveColName的文档数据为:" $docQty
  36. ###### End #####
  37. ###### Start 定义每次备份归档的最大阈值,防止意外情况的发生,例如:参数输入错误###
  38. if [ $docQty -gt 2000000 ];then
  39. echo "MongoDB-Archive-Exception:NeedArchiveDBColName库NeedArchiveColName集合指定时间段内的文档数过大,超过定义的安全阈值 2000000,归档终止,请检查!"
  40. exit
  41. fi
  42. ####### end ######
  43. ######## start 连接目标Server DB ,检查target DB 上是否已经存在此时间内的文档
  44. command_lineT="${command_linebinT} 归档实例IP:归档实例端口/归档数据库Name -u$username -p$password"
  45. export docQtyT=$(/bin/echo 'db.NeedArchiveColName.find({NeedArchiveByField:{$gte:new Date('\"$ParamBakStartDate\"'),$lt:new Date('\"$ParamBakEndDate\"')}}).count()' | $command_lineT --quiet)
  46. echo "备份目标BKDB集合NeedArchiveColName备份归档前的文档数据为:" $docQtyT
  47. if [ $docQtyT -gt 0 ];then
  48. echo "MongoDB-Archive-Exception:NeedArchiveDBColName库NeedArchiveColName集合检查发现指定时间段内目标数据库目标集合存在异常文档数,归档终止,请检查!"
  49. exit
  50. fi
  51. ####### end ######
  52. ####### start mongoexport 指定集合指定时间段内的文档,输出到指定路径下;并执行检查命令是否正常执行####
  53. start()
  54. {
  55. echo "NeedArchiveDBColName库NeedArchiveColName集合备份输出开始"
  56. /QQMSG/mongo_db/mongobin404/bin/mongoexport --port 端口号 -u $username -p $password -d NeedArchiveDBColName --authenticationDatabase NeedArchiveDBColName -c NeedArchiveColName -q ' { NeedArchiveByField: { $gte:new Date('$ParamBakStartTimeMS'),$lt:new Date('$ParamBakEndTimeMS') } } ' -o ${targetpath}/${bakcollectionname}
  57. echo "NeedArchiveDBColName库NeedArchiveColName集合备份输出完毕"
  58. }
  59. start
  60. execute()
  61. {
  62. if [ $? -eq 0 ]
  63. then
  64. echo "The MongoDB 集合 NeedArchiveColName 文档mongoexport完成!"
  65. else
  66. echo "The MongoDB 集合 NeedArchiveColName 文档mongoexport失败"
  67. exit
  68. fi
  69. }
  70. ###### end ######
  71. ###### Start mongomongoimport 将导出的备份集合导入到指定的BKDB 指定的集合中#####
  72. echo "备份输入开始"
  73. /QQMSG/mongo_db/mongobin404/bin/mongoimport -h 归档实例IP --port 归档实例端口 -u $username -p $password -d 归档数据库Name --authenticationDatabase 归档数据库Name -c NeedArchiveColName --file ${targetpath}/${bakcollectionname}
  74. echo "备份输入完毕"
  75. ##### End #######
  76. ######## start 连接目标Server DB ,检查target DB 上是否已经存在此时间内的文档
  77. export docQtyT2=$(/bin/echo 'db.NeedArchiveColName.find({NeedArchiveByField:{$gte:new Date('\"$ParamBakStartDate\"'),$lt:new Date('\"$ParamBakEndDate\"')}}).count()' | $command_lineT --quiet)
  78. echo "备份目标BKDB集合NeedArchiveColName备份归档后的文档数据为:" $docQtyT2
  79. echo "比较docQty 和 docQtyT2 的大小"
  80. if [ $docQty == $docQtyT2 ]; then
  81. echo "正常:时间段内源数据库集合中的文档数 和 目标数据库集合中还原后的文档数据 相等";
  82. elif [ $docQty -gt $docQtyT2 ]; then
  83. echo "MongoDB-Archive-Exception:时间段内源数据库集合中的文档数 大于 目标数据库集合中还原后的文档数据";
  84. exit
  85. else
  86. echo "MongoDB-Archive-Exception:时间段内源数据库集合中的文档数 小于 目标数据库集合中还原后的文档数据";
  87. exit
  88. fi
  89. ########### End #####
  90. ########### Start Remove 源数据库源集合指定时间内的记录 ########
  91. docQtyR=$(/bin/echo 'db.NeedArchiveColName.remove({NeedArchiveByField:{$gte:new Date('$ParamBakStartTimeMS'),$lt:new Date('$ParamBakEndTimeMS')}}).nRemoved' | $command_line --quiet)
  92. echo "本次操作Remove集合NeedArchiveColName的文档数据为:" $docQtyR
  93. ########## End #########
  94. ###### 检查 Remove 后集合的文档数 ###
  95. docQty=$(/bin/echo 'db.NeedArchiveColName.find({NeedArchiveByField:{$gte:new Date('\"$ParamBakStartDate\"'),$lt:new Date('\"$ParamBakEndDate\"')}}).count()' | $command_line --quiet)
  96. echo "NeedArchiveDBColName库NeedArchiveColName集合 此次 Remove 后指定时间剩余的文档数据为:" $docQty
  97. ###### End ###
  98. #########删除导出的文件#######
  99. rm -rf ${targetpath}/${bakcollectionname}
  100. if [ $? -eq 0 ]
  101. then
  102. echo "正常:NeedArchiveDBColName库NeedArchiveColName集合导出的文件被删除:" ${targetpath}/${bakcollectionname}
  103. else
  104. echo "MongoDB-Archive-Exception:NeedArchiveDBColName库NeedArchiveColName集合导出的文件未被正常删除" ${targetpath}/${bakcollectionname}
  105. fi
  106. ######## End #####

 

4. 代码说明

4.1 配置基本信息

主要包括:mongo bin 可执行文件所在路径;导出过渡文件的定义;归档账号和密码;集合数据保留天数。

4.2 代码中关键词

明白关键字的含义,可在部署运行前,批量替换

代码中关键词 关键词意义
  1. NeedArchiveDBColName
需要归档的集合所在数据库;
  1. NeedArchiveColName
需要归档的集合名字;
  1. 归档数据库Name
  1. 归档数据库Name
  1. NeedArchiveByField
归档依据的字段;此例中是Date类型的字段,其他类型还要调试。
 /QQMSG/mongo_db/mongobin404/bin  Mongo 可执行文件所在路径
 2000000  归档的最大阈值
 ArchiveDB_端口号  过渡文件所放的位置,一个数据库一个文档。不用细化到集合
端口号 端口号分为源库所在实例端口,和目标库所在实例端口

4.3 在本例中,源库和目标库设置了相同的归档账号和对应密码

4.4  通过crontab 实现日常归档,执行信息(异常错误)重定向到log文件

归档实现代码保存到文件中,通过crontab设置文件的定时任务,实现日常归档。

执行情况 重定向( >>)到指定文件。通过指定文件的监视可实现监控归档的执行情况。

 

 

 

本文版权归作者所有,未经作者同意不得转载,谢谢配合!!!

本文版权归作者所有,未经作者同意不得转载,谢谢配合!!!

本文版权归作者所有,未经作者同意不得转载,谢谢配合!!!

原文链接:http://www.cnblogs.com/xuliuzai/p/10698241.html

 友情链接:直通硅谷  点职佳  北美留学生论坛

本站QQ群:前端 618073944 | Java 606181507 | Python 626812652 | C/C++ 612253063 | 微信 634508462 | 苹果 692586424 | C#/.net 182808419 | PHP 305140648 | 运维 608723728

W3xue 的所有内容仅供测试,对任何法律问题及风险不承担任何责任。通过使用本站内容随之而来的风险与本站无关。
关于我们  |  意见建议  |  捐助我们  |  报错有奖  |  广告合作、友情链接(目前9元/月)请联系QQ:27243702 沸活量
皖ICP备17017327号-2 皖公网安备34020702000426号