处理文本

  • find、

  • grep、

  • xargs、

  • sort、

  • uniq、

  • tr、

  • cut、

  • paste、

  • wc、

  • sed、

  • awk;

1、find 文件查找

# 查找 txt 和 pdf 文件
find . \( -name "*.txt" -o -name "*.pdf" \) -print

# 正则方式查找.txt 和 pdf
find . -regex ".*\(\.txt|\.pdf\)$"  # -regex:忽略大小写的正则

# 否定参数,查找所有非 txt 文本
find . ! -name "*.txt" -print

# 指定搜索深度打印出当前目录的文件(深度为 1)
find . -maxdepth 1 -type f

定制搜索

2、grep 文本搜索

3、xargs 命令行参数转换

xargs 能够将输入数据转化为特定命令的命令行参数;这样,可以配合很多命令来组合使用。比如 grep,比如 find。

4、sort 排序

5、uniq 消除重复行

6、用 tr 进行转换

7、cut 按列切分文本

8、paste 按列拼接文本

9、wc 统计行和字符的工具

10、sed 文本替换利器

11、awk 数据流处理工具

awk 脚本结构 awk ‘ BEGIN{statements} statements2 END{ statements } ‘

工作方式:

  1. 执行 begin 中语句块;

  2. 从文件或 stdin 中读入一行,然后执行 statements2,重复这个过程,直到文件全部被读取完毕;

  3. 执行 end 语句块;

  4. print 打印当前行

12、迭代文件中的行、单词和字符

最后更新于