为什么文本文件应该以换行符结尾？ - Code

我想这里的每个人都熟悉这句谚语，即所有文本文件都应该以换行符结尾。我已经知道这个“规则”很多年了，但我一直在想——为什么？

当前回答

最后缺少换行符的文件还有一个实际的编程问题：read-Bash内置（我不知道其他read实现）无法按预期工作：

printf $'foo\nbar' | while read line
do
    echo $line
done

这只打印foo！原因是，当read遇到最后一行时，它将内容写入$line，但返回退出代码1，因为它已到达EOF。这打破了while循环，因此我们永远无法到达echo$line部分。如果要处理这种情况，必须执行以下操作：

while read line || [ -n "${line-}" ]
do
    echo $line
done < <(printf $'foo\nbar')

也就是说，如果由于文件末尾的非空行导致读取失败，则执行回显。当然，在这种情况下，输出中将有一个额外的换行符，而输入中没有。

2011-11-04 10:12:54

其他回答

基本上，如果没有得到最终EOL EOF，许多程序将无法正确处理文件。

GCC警告您这一点，因为它是C标准的一部分。（第5.1.1.2节明显）

“文件末尾没有换行符”编译器警告

2009-04-08 12:21:13

为什么（文本）文件应该以换行符结尾？

正如许多人所表达的，因为：

许多程序运行不好，或者没有它就会失败。即使能很好地处理文件的程序缺少结尾“\n”，该工具的功能也可能无法满足用户的期望——在这种情况下，这一点可能不清楚。程序很少禁止最后的“\n”（我不知道有）。

然而，这引出了下一个问题：

代码应该如何处理没有换行符的文本文件？

最重要的是，不要编写假设文本文件以换行符结尾的代码。假设文件符合某种格式会导致数据损坏、黑客攻击和崩溃。例子：//错误的代码while（fgets（buf，buf大小，instream））{//如果没有\n，buf[]被截断，会发生什么buf[strlen（buf）-1]=“\0”；//尝试删除尾部\n...}如果需要最后一个结尾“\n”，请提醒用户该结尾不存在以及所采取的操作。IOW，验证文件的格式。注意：这可能包括对最大行长度、字符编码等的限制。清楚地定义，文档，代码对缺少final“\n”的处理。尽可能不要生成缺少结尾“\n”的文件。

2015-06-20 15:26:39

为什么文本文件应该以换行符结尾？

因为这是最明智的选择。

获取包含以下内容的文件：，

one\n
two\n
three

其中，\n表示换行符，在Windows上是返回字符，\r\n后跟换行符，因为它很酷，对吗？

这个文件有多少行？Windows说3，我们说3，POSIX（Linux）说文件是残缺的，因为文件末尾应该有一个。

无论如何，你会说它的最后一行是什么？我想任何人都同意三行是文件的最后一行，但POSIX表示这是一个残缺的行。

第二行是什么？哦，这里有第一个强烈的分离：

Windows说两个是因为文件是“用换行符分隔的行”（wth？）；POSIX说2，并补充说这是一条真实、诚实的路线。

那么，选择Windows的后果是什么？简单：

你不能说文件是由行组成的

为什么？尝试从上一个文件中取出最后一行并复制几次。。。你得到了什么？这：

one\n
two\n
threethreethreethree

相反，尝试交换第二行和第三行。。。你会发现：

one\n
threetwo\n

因此

您必须说，文本文件是行和\n的交替，以行开始，以行结束

这真是一口，对吧？

你想要另一个奇怪的结果？

你必须接受一个空文件（0字节，实际上是0位）是一个单行文件，神奇的是，因为它们在微软很酷

这真是太疯狂了，你不觉得吗？

POSIX选择的后果是什么？

顶部的文件有点残缺，我们需要一些黑客来处理它。

是认真的

在前面的文本中，我是挑衅性的，因为处理缺少结尾的文本文件会迫使您使用特殊的滴答声/黑客来处理它们。你总是需要一个if/else来让事情运转起来，其中处理残缺行的分支只处理残缺行，所有其他行都采用另一个分支。这有点种族主义，不是吗？

我的结论

我赞成POSIX对行的定义，原因如下：

文件自然被认为是一系列行一行不应该是这样或那样的，这取决于它在文件中的位置空文件不是单行文件，拜托！您不应该被迫对代码进行黑客攻击

是的，Windows确实鼓励您省略后面的\r\n。如果需要下面的两行文件，则必须省略尾部，否则文本编辑器会将其显示为三行文件：

2021-04-30 16:58:36

很可能只是一些解析代码希望它在那里。

我不确定我是否会认为这是一条“规则”，而且这肯定不是我虔诚地遵守的。最明智的代码将知道如何逐行解析文本（包括编码）（任何行结尾的选择），最后一行是否有换行符。

的确，如果你以一条新的线结束：EOL和EOF之间（理论上）是否有一条空的最终线？一个值得思考的。。。

2009-04-08 12:19:54

一个单独的用例：当文本文件受版本控制时，提交卫生。

如果将内容添加到文件末尾，则先前是最后一行的行将被编辑为包含换行符。这意味着，打开文件以了解该行最后一次编辑的时间将显示换行符添加，而不是您实际希望看到的提交。

（该示例特定于git，但同样的方法也适用于其他版本控制系统。）

2016-09-05 13:17:51

aliyun