经验首页 前端设计 程序设计 Java相关 移动开发 数据库/运维 软件/图像 大数据/云计算 其他经验
当前位置:技术经验 » 数据库/运维 » Linux/Shell » 查看文章
linux三剑客之awk
来源:cnblogs  作者:zong涵  时间:2021/12/24 8:56:48  对本文有异议

linux三剑客之awk

适用范围:awk主要是用来格式化文本。

1、awk的语法

语法格式:awk [参数] [处理规则] [操作对象]

2、参数

参数 作用
-F 指定文本分隔符(不写默认是以空格作为分隔符)

3、awk的生命周期

  1. grepsedawk都是读一行处理一行,直至处理完成。
  2. 1、接收一行作为输入
  3. 2、把刚刚读入进来得到文本进行分解
  4. 3、使用处理规则处理文本
  5. 4、输出一行,赋值给$0,直至处理完成
  6. 5、把处理完成之后的所有的数据交给END{}来再次处理

4、awk中的预定义变量

变量 作用
$0 代表当前行
$n 代表第n列
NF 代指当前行的总字段数
NR 代指行号
FS 指定文本内容分隔符,优先级要高于 -F,默认是空格
OFS 指定打印的分隔符,是自定义的分隔符,默认是空格
  1. # NF(代指数字,每行被分割后的总字段数)
  2. [root@zonghan ~]# cat 8.txt
  3. asfsdgs asdsad asdasdsa
  4. sdfsdfas sadasdsad
  5. aSD asd
  6. asd asdsad sad
  7. asdasd
  8. asdasdas sadsadasd
  9. asdasd asdsadssfgsad sadsa
  10. [root@zonghan ~]# awk '{print NF}' 8.txt
  11. 3
  12. 2
  13. 2
  14. 3
  15. 1
  16. 2
  17. 3
  18. 0
  19. [root@zonghan ~]# awk '{print $NF}' 8.txt
  20. asdasdsa
  21. sadasdsad
  22. asd
  23. sad
  24. asdasd
  25. sadsadasd
  26. sadsa # $NF就是变相于打印NF所代表的列,又因为NF是总字段数,所以是打印最后一列
  27. # $0(代指代表当前行)
  28. [root@zonghan ~]# awk -F: '{print $0, "---"}' 8.txt
  29. asfsdgs asdsad asdasdsa ---
  30. sdfsdfas sadasdsad ---
  31. aSD asd ---
  32. asd asdsad sad ---
  33. asdasd ---
  34. asdasdas sadsadasd ---
  35. asdasd asdsadssfgsad sadsa ---
  36. --- # 由此可以得出$0是代指的每一行的内容
  37. # $n (代表第n列)
  38. [root@zonghan ~]# awk '{print $1}' 8.txt
  39. asfsdgs
  40. sdfsdfas
  41. aSD
  42. asd
  43. asdasd
  44. asdasdas
  45. asdasd # 打印的是第1列
  46. [root@zonghan ~]# awk '{print $2}' 8.txt
  47. asdsad
  48. sadasdsad
  49. asd
  50. asdsad
  51. # 这里因为文本没第二列 所以为空
  52. sadsadasd
  53. asdsadssfgsad # 打印的是第2列
  54. # NR(代指行号)
  55. [root@zonghan ~]# awk '{print NR}' 8.txt
  56. 1
  57. 2
  58. 3
  59. 4
  60. 5
  61. 6
  62. 7
  63. 8
  64. # FS(指定文本内容分隔符,优先级要高于 -F,默认是空格)
  65. [root@zonghan ~]# cat /etc/passwd
  66. root:x:0:0:root:/root:/bin/bash
  67. bin:x:1:1:bin:/bin:/sbin/nologin
  68. daemon:x:2:2:daemon:/sbin:/sbin/nologin
  69. [root@zonghan ~]# awk -F: 'BEGIN{FS="x"}{print $NF}' /etc/passwd
  70. :0:0:root:/root:/bin/bash
  71. :1:1:bin:/bin:/sbin/nologin
  72. :2:2:daemon:/sbin:/sbin/nologin # 这里可以看出是以x分割而不是以-F的:分割的,所以优先级高于-F
  73. # 0FS(指定打印的分隔符,自定义的分隔符,默认是空格)
  74. [root@zonghan ~]# awk -F: 'BEGIN{OFS=">>>"}{print $1, $NF}' /etc/passwd
  75. root>>>/bin/bash
  76. bin>>>/sbin/nologin
  77. daemon>>>/sbin/nologin

5、awk处理规则的执行流程

  1. # 至少1个,最多4个 按以下顺序
  2. BEGIN{} # 括号里面内容会在awk读取文件之前执行
  3. // # 正则表达式
  4. {} # 循环
  5. END{} # 括号里面内容会在awk读取文件之后执行

6、awk中的函数

函数名 作用
print 打印
printf 格式化打印
%s 字符串
%d 数字
- 左对齐
+ 右对齐
15 至少占用15字符
  1. # 格式化打印
  2. [root@zonghan ~]# awk -F: 'BEGIN{OFS=" | "}{printf "|%s|%s|\n", $1, $NF}' /etc/passwd
  3. |root|/bin/bash|
  4. |bin|/sbin/nologin|
  5. |daemon|/sbin/nologin|
  6. [root@zonghan ~]# awk -F: 'BEGIN{OFS=" | "}{printf "|%-15s|%s|\n", $1, $NF}' /etc/passwd
  7. |root |/bin/bash|
  8. |bin |/sbin/nologin|
  9. |daemon |/sbin/nologin|
  10. [root@zonghan ~]# awk -F: 'BEGIN{OFS=" | "}{printf "|%-15s|%-15s|\n", $1, $NF}' /etc/passwd
  11. |root |/bin/bash |
  12. |bin |/sbin/nologin |
  13. |daemon |/sbin/nologin |
  14. [root@zonghan ~]# awk -F: 'BEGIN{OFS=" | "}{printf "|%+15s|%+15s|\n", $1, $NF}' /etc/passwd
  15. | root| /bin/bash|
  16. | bin| /sbin/nologin|
  17. | daemon| /sbin/nologin|
  18. [root@zonghan ~]# awk -F: 'BEGIN{OFS=" | "}{printf "|%+15s|%-15s|\n", $1, $NF}' /etc/passwd
  19. | root|/bin/bash |
  20. | bin|/sbin/nologin |
  21. | daemon|/sbin/nologin |

7、awk中的定位

1、正则表达式

  1. # 打印出包含root的所有行
  2. [root@zonghan ~]# awk -F: '/root/{print $0}' /etc/passwd
  3. root:x:0:0:root:/root:/bin/bash
  4. operator:x:11:0:operator:/root:/sbin/nologin
  5. # 打印以root开头的所有行
  6. [root@zonghan ~]# awk -F: '/^root/{print $0}' /etc/passwd
  7. root:x:0:0:root:/root:/bin/bash

2、比较表达式(作用的是文本内的内容)

符号 作用
> 筛选大于的数据
>= 筛选大于等于的数据
< 筛选小于的数据
<= 筛选小于等于的数据
~ 包含(和正则连用)
!~ 不包含(和正则连用)
  1. # 打印第四列比第三列数值大的所有行信息
  2. [root@zonghan ~]# awk -F: '$4>$3{print $0}' /etc/passwd
  3. adm:x:3:4:adm:/var/adm:/sbin/nologin
  4. lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
  5. mail:x:8:12:mail:/var/spool/mail:/sbin/nologin
  6. games:x:12:100:games:/usr/games:/sbin/nologin
  7. ftp:x:14:50:FTP User:/var/ftp:/sbin/nologin
  8. # 结尾包含bash的行
  9. [root@zonghan ~]# awk -F: '$NF ~ /bash/{print $0}' /etc/passwd
  10. root:x:0:0:root:/root:/bin/bash
  11. haha:x:1000:1000::/home/haha:/bin/bash
  12. test1:x:1001:1000::/home/test1:/bin/bash
  13. # 结尾不包含bash的行
  14. [root@zonghan ~]# awk -F: '$NF !~ /bash/{print $0}' /etc/passwd
  15. bin:x:1:1:bin:/bin:/sbin/nologin
  16. daemon:x:2:2:daemon:/sbin:/sbin/nologin
  17. adm:x:3:4:adm:/var/adm:/sbin/nologin
  18. lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin

3、逻辑表达式

符号 作用
&& 逻辑与
| | 逻辑或
! 逻辑非
  1. # 打印第3列和第4列既要相加大于2000又要相乘大于2000的所有行
  2. [root@zonghan ~]# awk -F: '$3+$4>2000 && $3*$4>2000{print $0}' /etc/passwd
  3. test1:x:1001:1000::/home/test1:/bin/bash
  4. test2:x:1002:1000::/home/test2:/bin/bash
  5. data:x:2000:2000::/home/data:/bin/bash
  6. aaa:x:2001:2001::/home/aaa:/bin/bash
  7. bbb:x:2002:2001::/home/bbb:/bin/bash
  8. ddd:x:2003:1000::/home/ddd:/bin/bash
  9. eee:x:1999:1999::/home/eee:/bin/bash
  10. fff:x:1500:1500::/home/fff:/bin/bash
  11. # 打印第3列和第4列相加大于2000或者相乘大于2000的所有行
  12. [root@zonghan ~]# awk -F: '$3+$4>2000 || $3*$4>2000{print $0}' /etc/passwd
  13. daemon:/dev/null:/sbin/nologin
  14. abrt:x:173:173::/etc/abrt:/sbin/nologin
  15. sshd:x:74:74:Privilege-separated SSH:/var/empty/sshd:/sbin/nologin
  16. postfix:x:89:89::/var/spool/postfix:/sbin/nologin
  17. haha:x:1000:1000::/home/haha:/bin/bash
  18. test1:x:1001:1000::/home/test1:/bin/bash
  19. test2:x:1002:1000::/home/test2:/bin/bash
  20. data:x:2000:2000::/home/data:/bin/bash
  21. aaa:x:2001:2001::/home/aaa:/bin/bash
  22. bbb:x:2002:2001::/home/bbb:/bin/bash
  23. ddd:x:2003:1000::/home/ddd:/bin/bash
  24. eee:x:1999:1999::/home/eee:/bin/bash
  25. fff:x:1500:1500::/home/fff:/bin/bash
  26. # 打印第3列和第4列相加不大于2000或者相乘不大于2000的所有行
  27. [root@zonghan ~]# awk -F: '!($3+$4>2000 || $3*$4>2000){print $0}' /etc/passwd
  28. root:x:0:0:root:/root:/bin/bash
  29. bin:x:1:1:bin:/bin:/sbin/nologin
  30. daemon:x:2:2:daemon:/sbin:/sbin/nologin
  31. adm:x:3:4:adm:/var/adm:/sbin/nologin
  32. lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
  33. sync:x:5:0:sync:/sbin:/bin/sync
  34. shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
  35. halt:x:7:0:halt:/sbin:/sbin/halt
  36. mail:x:8:12:mail:/var/spool/mail:/sbin/nologin
  37. operator:x:11:0:operator:/root:/sbin/nologin
  38. games:x:12:100:games:/usr/games:/sbin/nologin
  39. ftp:x:14:50:FTP User:/var/ftp:/sbin/nologin

4、算术表达式

符号 作用
+
-
*
/
== 等于
%
  1. # 打印第3列加第4列数值大于3000(属主+属组>3000)的行
  2. [root@zonghan ~]# awk -F: '$3+$4>3000{print $0}' /etc/passwd
  3. data:x:2000:2000::/home/data:/bin/bash
  4. aaa:x:2001:2001::/home/aaa:/bin/bash
  5. bbb:x:2002:2001::/home/bbb:/bin/bash
  6. ddd:x:2003:1000::/home/ddd:/bin/bash
  7. eee:x:1999:1999::/home/eee:/bin/bash
  8. # 打印第3列乘第4列数值大于50(属主+属组>3000)的行
  9. [root@zonghan ~]# awk -F: '$3*$4<50{print $0}' /etc/passwd
  10. root:x:0:0:root:/root:/bin/bash
  11. bin:x:1:1:bin:/bin:/sbin/nologin
  12. daemon:x:2:2:daemon:/sbin:/sbin/nologin
  13. adm:x:3:4:adm:/var/adm:/sbin/nologin
  14. lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
  15. sync:x:5:0:sync:/sbin:/bin/sync
  16. # 打印所有奇数行
  17. [root@zonghan ~]# awk -F: 'NR%2==1{print $0}' /etc/passwd
  18. root:x:0:0:root:/root:/bin/bash
  19. daemon:x:2:2:daemon:/sbin:/sbin/nologin
  20. lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
  21. shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
  22. mail:x:8:12:mail:/var/spool/mail:/sbin/nologin
  23. games:x:12:100:games:/usr/games:/sbin/nologin
  24. nobody:x:99:99:Nobody:/:/sbin/nologin
  25. dbus:x:81:81:System message bus:/:/sbin/nologin

5、条件表达式(作用的是文本外的内容)

符号 限制条件
== 相等
> 大于
>= 大于等于
< 小于
<= 小于等于
  1. # 打印第3行的内容
  2. [root@zonghan ~]# awk -F: 'NR==3{print $0}' /etc/passwd
  3. daemon:x:2:2:daemon:/sbin:/sbin/nologin
  4. # 打印前4行的的内容
  5. [root@zonghan ~]# awk -F: 'NR<=4{print $0}' /etc/passwd
  6. root:x:0:0:root:/root:/bin/bash
  7. bin:x:1:1:bin:/bin:/sbin/nologin
  8. daemon:x:2:2:daemon:/sbin:/sbin/nologin
  9. adm:x:3:4:adm:/var/adm:/sbin/nologin

6、范围表达式

符号 作用
逗号 , 什么行至什么行
  1. # 打印出以root开头的行到以ftp开头的行
  2. [root@zonghan ~]# awk -F: '/^root/,/^ftp/{print $0}' /etc/passwd
  3. root:x:0:0:root:/root:/bin/bash
  4. bin:x:1:1:bin:/bin:/sbin/nologin
  5. daemon:x:2:2:daemon:/sbin:/sbin/nologin
  6. mail:x:8:12:mail:/var/spool/mail:/sbin/nologin
  7. operator:x:11:0:operator:/root:/sbin/nologin
  8. games:x:12:100:games:/usr/games:/sbin/nologin
  9. ftp:x:14:50:FTP User:/var/ftp:/sbin/nologin

8、流程控制

特别注意:只存在循环{ }之中

符号 用法
if 判断
for 循环
while 循环

if用法

语法:

{ if ( ) { } }

{ if ( ) { } else { } }

{ if ( ) { } else if ( ) { } else { } }

  1. # 判断第3行与第4行数值的大小,输出比较结果
  2. [root@zonghan ~]# awk -F: '{if($3>$4){print "大于"} else {print "小于等于"}' /etc/passwd
  3. 小于等于
  4. 小于等于
  5. 小于等于
  6. 小于等于
  7. 小于等于
  8. 大于
  9. 大于

for用法

语法:

{ for (i=初始值; 条件判断; 游标) { } }

  1. # 每行打印3次
  2. [root@zonghan ~]# awk -F: '{for(i=0;i<3;i++1){print $0}}' /etc/passwd
  3. root:x:0:0:root:/root:/bin/bash
  4. root:x:0:0:root:/root:/bin/bash
  5. root:x:0:0:root:/root:/bin/bash
  6. bin:x:1:1:bin:/bin:/sbin/nologin
  7. bin:x:1:1:bin:/bin:/sbin/nologin
  8. bin:x:1:1:bin:/bin:/sbin/nologin
  9. daemon:x:2:2:daemon:/sbin:/sbin/nologin
  10. daemon:x:2:2:daemon:/sbin:/sbin/nologin
  11. daemon:x:2:2:daemon:/sbin:/sbin/nologin
  12. ...

while用法

语法 :

{ i=初始值 ; while(条件判断) { } }

  1. # 每行打印3次
  2. [root@zonghan ~]# awk -F: '{i=0;while(i<3){i++;print $0}}' /etc/passwd
  3. root:x:0:0:root:/root:/bin/bash
  4. root:x:0:0:root:/root:/bin/bash
  5. root:x:0:0:root:/root:/bin/bash
  6. bin:x:1:1:bin:/bin:/sbin/nologin
  7. bin:x:1:1:bin:/bin:/sbin/nologin
  8. bin:x:1:1:bin:/bin:/sbin/nologin
  9. daemon:x:2:2:daemon:/sbin:/sbin/nologin
  10. daemon:x:2:2:daemon:/sbin:/sbin/nologin
  11. daemon:x:2:2:daemon:/sbin:/sbin/nologin
  12. ...
  13. # 如果想打印i数字的变化,可以在print里加上i++
  14. [root@zonghan ~]# awk -F: '{i=0;while(i<3){print $0, i++}}' /etc/passwd
  15. root:x:0:0:root:/root:/bin/bash 0
  16. root:x:0:0:root:/root:/bin/bash 1
  17. root:x:0:0:root:/root:/bin/bash 2
  18. bin:x:1:1:bin:/bin:/sbin/nologin 0
  19. bin:x:1:1:bin:/bin:/sbin/nologin 1
  20. bin:x:1:1:bin:/bin:/sbin/nologin 2
  21. daemon:x:2:2:daemon:/sbin:/sbin/nologin 0
  22. daemon:x:2:2:daemon:/sbin:/sbin/nologin 1
  23. daemon:x:2:2:daemon:/sbin:/sbin/nologin 2
  24. ...

原文链接:http://www.cnblogs.com/zonghan/p/15721169.html

 友情链接:直通硅谷  点职佳  北美留学生论坛

本站QQ群:前端 618073944 | Java 606181507 | Python 626812652 | C/C++ 612253063 | 微信 634508462 | 苹果 692586424 | C#/.net 182808419 | PHP 305140648 | 运维 608723728

W3xue 的所有内容仅供测试,对任何法律问题及风险不承担任何责任。通过使用本站内容随之而来的风险与本站无关。
关于我们  |  意见建议  |  捐助我们  |  报错有奖  |  广告合作、友情链接(目前9元/月)请联系QQ:27243702 沸活量
皖ICP备17017327号-2 皖公网安备34020702000426号