处理空行

可用的命令

  • sed:过滤和替换文本的流编辑器

  • grep:输出匹配到的行

  • cat:合并文件并打印内容到标准输出

  • tr:替换或删除字符

  • awk:awk 工具用于执行 awk 语言编写的程序,专门用于文本处理

  • perl:Perl 是一种用于处理文本的编程语言

sed

sed 是一个 流编辑器(stream editor)。流编辑器是用来编辑输入流(文件或管道)中的文本的。

sed '/^$/d' test

以下是命令展开的细节:

  • sed: 该命令本身。

  • //: 标记匹配范围。

  • ^: 匹配字符串开头。

  • $: 匹配字符串结尾。

  • d: 删除匹配的字符串。

  • test: 源文件名。

grep

使用 grep 命令 grep 可以通过正则表达式在文件中搜索。该表达式可以是一行或多行空行分割的字符,grep 会打印所有匹配的内容。

$ grep . test
# or
$ grep -Ev "^$" test
# or
$ grep -v -e '^$' test

以下是命令展开的细节:

  • grep: 该命令本身。

  • .: 替换任意字符。

  • ^: 匹配字符串开头。

  • $: 匹配字符串结尾。

  • E: 使用扩展正则匹配模式。

  • e: 使用常规正则匹配模式。

  • v: 反向匹配。

  • test: 源文件名。

awk

awk 可以执行使用 awk 语言写的脚本,大多是专用于处理文本的。awk 脚本是一系列 awk 命令和正则的组合。

$ awk NF test
# or
$ awk '!/^$/' test
# or
$ awk '/./' test

以下是命令展开的细节:

  • awk: 该命令本身。

  • //: 标记匹配范围。

  • ^: 匹配字符串开头。

  • $: 匹配字符串结尾。

  • .: 匹配任意字符。

  • !: 删除匹配的字符串。

  • test: 源文件名。

cat 和 tr

cat 是 串联(拼接)(concatenate)的简写。经常用于在 Linux 中读取一个文件的内容。

cat 是在类 Unix 系统中使用频率最高的命令之一。它提供了常用的三个处理文本文件的功能:显示文件内容、将多个文件拼接成一个,以及创建一个新文件。

tr 可以将标准输入中的字符转换,压缩或删除,然后重定向到标准输出。

cat test | tr -s ' '

以下是命令展开的细节:

  • cat: cat 命令本身。

  • tr: tr 命令本身。

  • |: 管道符号。它可以将前面的命令的标准输出作为下一个命令的标准输入。

  • s: 替换标数据集中任意多个重复字符为一个。

  • : 添加一个新的换行。

  • test: 源文件名。

perl

Perl 表示 实用的提取和报告语言(Practical Extraction and Reporting Language)。Perl 在初期被设计为一个专用于文本处理的编程语言,现在已扩展应用到 Linux 系统管理,网络编程和网站开发等多个领域。

perl -ne 'print if /S/' test

以下是命令展开的细节:

  • perl: perl 命令。

  • n: 逐行读入数据。

  • e: 执行某个命令。

  • print: 打印信息。

  • if: if 条件分支。

  • //: 标记匹配范围。

  • S: 匹配任意非空白字符。

  • test: 源文件名。

最后更新于

这有帮助吗?