经验首页 前端设计 程序设计 Java相关 移动开发 数据库/运维 软件/图像 大数据/云计算 其他经验
当前位置:技术经验 » 数据库/运维 » Linux/Shell » 查看文章
wget 命令用法
来源:cnblogs  作者:librarookie  时间:2021/4/19 8:49:57  对本文有异议

wget 命令用法



1. 用法/命令格式

  1. wget [OPTION]... [URL]...
  2. wget [参数列表] [目标软件、网页的网址]

长选项所必须的参数在使用短选项时也是必须的


2. 常用参数

  • 启动:
  1. -V, --version # 显示 Wget 的版本信息并退出
  2. -h, --help # 打印帮助
  3. -b, --background # 启动后转入后台
  • 记录和输入文件:
  1. -o, --output-file=FILE # 将日志信息写入【FILE】
  2. -a, --append-output=FILE # 将信息添加至【FILE】
  3. -q, --quiet # 安静模式 (无信息输出)
  4. -v, --verbose # 详细输出 (默认)
  5. -nv, --no-verbose # 关闭详细输出,但不进入安静模式
  6. -i, --input-file=FILE # 下载本地或外部 [FILE] 中的 URL
  • 下载:
  1. -t, --tries=NUMBER # 设置重试次数为【NUMBER】(0 代表无限制)
  2. --retry-connrefused # 即使拒绝连接也重试
  3. -O, --output-document=FILE # 将文档写入【FILE】(可以理解为把下载的文件重命名改为【FILE】)
  4. -nc, --no-clobber # 不要下载已存在文件
  5. -c, --continue # 断点续传下载文件(继续获取部分下载)
  6. -N, --timestamping # 只获取比本地文件新的文件
  7. -S, --server-response # 打印服务器响应头信息
  8. --spider # 不下载任何文件
  9. --limit-rate=RATE # 限制下载速率为 [RATE]
  10. --ignore-case # 匹配文件/目录时忽略大小写
  11. --user=USER # 将 ftp 和 http 的用户名均设置为【USER】
  12. --password=PASS # 将 ftp 和 http 的密码均设置为【PASS】
  13. --ask-password # 提示输入密码
  • 目录:
  1. -nd, --no-directories # 不创建目录(默认)
  2. -x, --force-directories # 强制创建目录
  3. ## 下面的参数需要配合 "-x" 参数使用
  4. -nH, --no-host-directories # 不要创建主机(www.cnglogs.com)目录
  5. --protocol-directories # 在目录中使用协议名称(从https开始创建目录)
  6. -P, --directory-prefix=PREFIX # 保存文件到指定的【PREFIX】目录
  7. --cut-dirs=NUMBER # 忽略远程目录中【NUMBER】个目录层。
  • HTTP选项:
  1. --http-user=USER # 设置 http 用户名为【USER】
  2. --http-password=PASS # 设置 http 密码为【PASS】
  3. --no-cache # 不使用服务器缓存的数据。
  4. --default-page=NAME # 改变默认页名称 (通常是“index.html”)
  5. --no-cookies # 不使用 cookies
  6. --save-cookies=FILE # 会话结束后保存 cookies 至【FILE】
  • HSTS选项:
  1. --no-hsts # 禁用 HSTS
  2. --hsts-file # HSTS 数据库路径(将覆盖默认值)
  • FTP选项:
  1. --ftp-user=USER # 设置 ftp 用户名为【USER】
  2. --ftp-password=PASS # 设置 ftp 密码为【PASS】
  3. --no-glob # 不在 FTP 文件名中使用通配符展开
  4. --preserve-permissions # 保留远程文件的权限
  5. --retr-symlinks # 递归目录时,获取链接的文件 (而非目录)
  • 递归下载:
  1. -r, --recursive # 指定递归下载
  2. -l, --level=NUMBER # 最大递归深度 (inf 或 0 代表无限制,即全部下载)。
  3. --delete-after # 下载完成后删除本地文件
  4. --backups=N # 写入文件 X 前,轮换移动最多 N 个备份文件
  5. -K, --backup-converted # 在转换文件 X 前先将它备份为 X.orig
  • 递归接受/拒绝:
  1. -A, --accept=LIST # 逗号分隔的可接受的扩展名列表
  2. -R, --reject=LIST # 逗号分隔的要拒绝的扩展名列表
  3. -D, --domains=LIST # 逗号分隔的可接受的域名列表
  4. --exclude-domains=LIST # 逗号分隔的要拒绝的域名列表
  5. -I, --include-directories=LIST # 允许目录的列表
  6. -X, --exclude-directories=LIST # 排除目录的列表
  7. -np, --no-parent # 不追溯至父目录

3. 常用实例

  • 下载单个文件/网页
  1. wget https://www.rarlab.com/rar/rarlinux-6.0.1.tar.gz # 下载rarlinux-6.0.1.tar.gz文件
  2. wget https://www.rarlab.com/download.htm # 下载 download.htm 网页
  • 将下载的文件名改为指定文件名 (参数 “O” )
  1. wget -O edit.html https://i.cnblogs.com/posts/editpostId=14660645
  2. # 默认下载保存的文件为“editpostId=14660645”
  3. # 使用 -O 参数后,保存的文件为指定文件名,这里是“edit.html”
  • 断点下载(参数 “c” )
  1. # 这个参数适合下载大文件,网速不理想的场景
  2. # 借助参数 "c", 可以继续从文件中断的地方继续下载
  3. wget -c https://www.rarlab.com/rar/rarlinux-6.0.1.tar.gz
  • 后台下载(参数 “b”)
  1. # 对于下载大文件时,我们可以使用参数 “b”,将进程切换到后台下载
  2. # 切换后台下载后,我们可以通过 “wget-log”查看下载进度
  3. # -t 参数表示重试次数,例如需要重试100次,那么就写-t 100,如果设成-t 0,那么表示无穷次重试,直到连接成功
  4. wget -b https://www.rarlab.com/rar/rarlinux-6.0.1.tar.gz
  • 批量下载(参数 “i”)
  1. # 自定义一个文件URLlist.txt,将需要下载的URL都输入进去,然后使用参数 “i”指定改文件即可
  2. wget -i URLlist.txt
  • 检查网页是否可访问,而不用下载(“S“:打印响应信息,“spaider”:不下载)
  1. wget [-S] --spaider https://www.cnblogs.com/cure/p/14660645.html
  • 指定文件格式下载(“A” 指定下载文件格式,“R”指定忽略下载文件格式)
  1. wget -A png https://www.cnblogs.com/ wget --accept=LIST https://www.cnblogs.com/
  2. wget -R gif https://www.cnblogs.com/ wget --reject=LIST https://www.cnblogs.com/
  3. # LIST表示可以指定多个格式
  • 指定用户名密码下载
  1. # 此场景适合部分访问需要用户名和密码验证的 URL下载
  2. wget --user=USER --password=PASS https://www.cnblogs.com/cure/p/14660645.html # 此方式密码明文显示
  3. wget --user=USER --ask-password https://www.cnblogs.com/cure/p/14660645.html # 此方式密码是按回车后,提示输入密码,密码不显示(推荐)
  • 下载URL中的当前位置的所有文件
  1. # 场景: 我需要下载文件服务器某一路径下的全部文件,但是不需要保存主页“index.html”
  2. wget -r -np -nd -R html,tmp https://www.cnblogs.com/cure/p/
  3. 或者:
  4. wget -r -np -nd -A txt,zip,png[...] https://www.cnblogs.com/cure/p/
  5. # 参数介绍:
  6. # -r 递归下载(最好跟上np参数,不然会下载整个网站的数据及关联网站数据)
  7. # -np 不追溯到父级(表示只访问当前位置)
  8. # -nd 不创建文件夹
  9. # -R 忽略/拒绝下载的格式(wget下载会默认下载主页“index.html”,拒绝下载html格式时,会保存为html.tmp文件)
  10. # -A 指定下载的格式(只下载指定格式的文件,这样也不会下载主页“index.html”)



参考:

https://www.jianshu.com/p/59bb131bc2ab

原文链接:http://www.cnblogs.com/cure/p/14660645.html

 友情链接:直通硅谷  点职佳  北美留学生论坛

本站QQ群:前端 618073944 | Java 606181507 | Python 626812652 | C/C++ 612253063 | 微信 634508462 | 苹果 692586424 | C#/.net 182808419 | PHP 305140648 | 运维 608723728

W3xue 的所有内容仅供测试,对任何法律问题及风险不承担任何责任。通过使用本站内容随之而来的风险与本站无关。
关于我们  |  意见建议  |  捐助我们  |  报错有奖  |  广告合作、友情链接(目前9元/月)请联系QQ:27243702 沸活量
皖ICP备17017327号-2 皖公网安备34020702000426号