经验首页 前端设计 程序设计 Java相关 移动开发 数据库/运维 软件/图像 大数据/云计算 其他经验
当前位置:技术经验 » 程序设计 » Python » 查看文章
Python实现FTP文件定时自动下载
来源:cnblogs  作者:Peanut_C  时间:2019/11/12 8:49:18  对本文有异议

  之前遇到技术问题总能在技术博客上得到启发,十分感谢各位的无私分享。而自己却很少发文,固然是水平有限,但也限制了知识积累和总结。今后多总结分享,回馈博客的同时也希望大家多多批评。

 

一、需求:

  某数据公司每日15:00~17:00之间,在其FTP发布当日数据供下载,我方需及时下载当日数据至指定本地目录。

 

二、分析:

  1、需实现FTP登陆、查询、下载功能;

  解答:使用内置的ftplib模块中FTP类;

 

  2、需判断文件是否下载;

  解答:使用os模块中path.exists方法;

 

  3、需判断在指定时间段内才执行下载任务;

  解答:使用内置的time模块抓取当前时间,并与指定时间做比较;

 

  4、需考虑日期切换问题;

  解答:使用内置的time模块抓取当前日期,并与变量中的日期做比较。

 

三、代码实现

  1. 1 #!/usr/bin/env python
  2. 2 # _*_ coding:utf-8 _*_
  3. 3
  4. 4 '''
  5. 5 @Time : 2019-11-11 13:30
  6. 6 @Author : Peanut_C
  7. 7 @FileName: ftp_auto_download.py
  8. 8 '''
  9. 9
  10. 10
  11. 11 import time
  12. 12 from ftplib import FTP
  13. 13 import os
  14. 14
  15. 15
  16. 16 remote_path = "/xxx/yy/z/" # 远端目录
  17. 17 begin_time = 1500 # 任务开始时间
  18. 18 end_time = 1700 # 任务结束时间
  19. 19
  20. 20
  21. 21 today = time.strftime("%Y%m%d") # 当天日期
  22. 22 today_file = today + 'test.txt' # 得到当天日期的目标文件名
  23. 23 remote_file = remote_path + today_file # 远端文件名
  24. 24 local_file = '\\\\local\\' + today + '\\' + today_file # 本地文件名
  25. 25 log_file = 'C:\\\\log\\ftp_log.txt'
  26. 26
  27. 27
  28. 28 def ftp_connect():
  29. 29 """用于FTP连接"""
  30. 30 ftp_server = 'w.x.y.z' # ftp站点对应的IP地址
  31. 31 username = 'ftpuser' # 用户名
  32. 32 password = 'ftppass' # 密码
  33. 33 ftp = FTP()
  34. 34 ftp.set_debuglevel(0) # 较高的级别方便排查问题
  35. 35 ftp.connect(ftp_server, 21)
  36. 36 ftp.login(username, password)
  37. 37 return ftp
  38. 38
  39. 39 def remote_file_exists():
  40. 40 """用于FTP站点目标文件存在检测"""
  41. 41 ftp = ftp_connect()
  42. 42 ftp.cwd(remote_path) # 进入目标目录
  43. 43 remote_file_names = ftp.nlst() # 获取文件列表
  44. 44 ftp.quit()
  45. 45 if today_file in remote_file_names:
  46. 46 return True
  47. 47 else:
  48. 48 return False
  49. 49
  50. 50 def download_file():
  51. 51 """用于目标文件下载"""
  52. 52 ftp = ftp_connect()
  53. 53 bufsize = 1024
  54. 54 fp = open(local_file, 'wb')
  55. 55 ftp.set_debuglevel(0) # 较高的级别方便排查问题
  56. 56 ftp.retrbinary('RETR ' + remote_file, fp.write, bufsize)
  57. 57 fp.close()
  58. 58 ftp.quit()
  59. 59
  60. 60
  61. 61 while True:
  62. 62 if int(time.strftime("%H%M")) in range(begin_time, end_time): # 判断是否在执行时间范围
  63. 63 if int(time.strftime("%Y%m%d")) - int(today) == 0: # 判断是否跨日期
  64. 64 while not os.path.exists(local_file): # 判断本地是否已有文件
  65. 65 if remote_file_exists(): # 判断远端是否已有文件
  66. 66 download_file()
  67. 67 with open(log_file, 'a') as f:
  68. 68 f.write('\n' + time.strftime("%Y/%m/%d %H:%M:%S") + " 今日文件已下载!")
  69. 69 time.sleep(60) # 下载完毕静默1分钟
  70. 70 else:
  71. 71 time.sleep(180)
  72. 72 break # 注意,此处跳出循环重新判断日期,避免周末或当天没文件时陷入内层循环
  73. 73 else:
  74. 74 time.sleep(180)
  75. 75 else:
  76. 76 """如果跨日期,则根据当前日期,更新各文件日期"""
  77. 77 today = time.strftime("%Y%m%d") # 当天日期
  78. 78 today_file = today + 'test.txt' # 得到当天日期的目标文件名
  79. 79 remote_file = remote_path + today_file # 远端文件名
  80. 80 local_file = '\\\\local\\' + today + '\\' + today_file # 本地文件名
  81. 81 with open(log_file, 'a') as f:
  82. 82 f.write('\n' + time.strftime("%Y/%m/%d %H:%M:%S") + " 任务启动, 文件日期已更新。")
  83. 83 else:
  84. 84 time.sleep(1800)

 

四、运行情况

  保存为pyw文件,任务在后台持续运行,不需要计划任务,省心省力。

  不用下载标记,一则较为简洁,二则本地文件如果被人误删或移动可自动重新下载。

  日志中,每天仅写入任务启动和文件已下载标志,并记录对应时间,如有需要可再添加。

 

  希望能帮到有需要的朋友。

 

  多多指教!

 

原文链接:http://www.cnblogs.com/baitme/p/11837017.html

 友情链接:直通硅谷  点职佳  北美留学生论坛

本站QQ群:前端 618073944 | Java 606181507 | Python 626812652 | C/C++ 612253063 | 微信 634508462 | 苹果 692586424 | C#/.net 182808419 | PHP 305140648 | 运维 608723728

W3xue 的所有内容仅供测试,对任何法律问题及风险不承担任何责任。通过使用本站内容随之而来的风险与本站无关。
关于我们  |  意见建议  |  捐助我们  |  报错有奖  |  广告合作、友情链接(目前9元/月)请联系QQ:27243702 沸活量
皖ICP备17017327号-2 皖公网安备34020702000426号