如何将DOS/Windows换行符(CRLF)转换为Unix换行符(LF)

如何以编程方式(不使用vi)将DOS/Windows换行符转换为Unix换行符?

dos2unix和unix2dos命令在某些系统上不可用。如何使用sed、awk和tr等命令模拟它们?

当前回答

我试着

sed 's/^M$//' file.txt

在OS X以及其他一些方法(修复Dos行结束或http://hintsforums.macworld.com/archive/index.php/t-125.html)。没有一个工作，文件保持不变(顺便说一下，需要按Ctrl + V, Enter来重新生成^M)。最后我使用了TextWrangler。它不是严格意义上的命令行，但它可以工作，而且不会抱怨。

2013-09-10 13:08:27

其他回答

The solutions posted so far only deal with part of the problem, converting DOS/Windows' CRLF into Unix's LF; the part they're missing is that DOS use CRLF as a line separator, while Unix uses LF as a line terminator. The difference is that a DOS file (usually) won't have anything after the last line in the file, while Unix will. To do the conversion properly, you need to add that final LF (unless the file is zero-length, i.e. has no lines in it at all). My favorite incantation for this (with a little added logic to handle Mac-style CR-separated files, and not molest files that're already in unix format) is a bit of perl:

perl -pe 'if ( s/\r\n?/\n/g ) { $f=1 }; if ( $f || ! $m ) { s/([^\n])\z/$1\n/ }; $m=1' PCfile.txt

注意，这将把文件的统一版本发送到标准输出。如果你想用一个统一的版本替换这个文件，添加perl的-i标志。

2010-04-10 17:50:06

这是超级duper容易与PCRE;

作为脚本，或者用文件替换$@。

#!/usr/bin/env bash
perl -pi -e 's/\r\n/\n/g' -- $@

这将覆盖您的文件! 我建议只在备份时这样做(版本控制或其他方式)

2015-07-30 17:38:45

在Linux上，使用sed很容易将^M (Ctrl + M)转换为*nix换行符(^J)。

在CLI中就像这样，文本中会有一个换行符。然而，\将^J传递给sed:

sed 's/^M/\
/g' < ffmpeg.log > new.log

你可以使用^V (Ctrl + V)， ^M (Ctrl + M)和\(反斜杠)当你输入:

sed 's/^V^M/\^V^J/g' < ffmpeg.log > new.log

2018-07-13 13:43:14

你可以使用tr从DOS转换到Unix;但是，只有当CR仅作为CRLF字节对的第一个字节出现在文件中时，才能安全地执行此操作。通常情况都是这样。然后使用:

tr -d '\015' <DOS-file >UNIX-file

注意DOS-file的名称不同于UNIX-file的名称;如果您尝试使用相同的名称两次，您将在文件中没有数据。

你不能反过来做(用标准的'tr')。

如果你知道如何在脚本中输入回车(control-V, control-M输入control-M)，那么:

sed 's/^M$//'     # DOS to Unix
sed 's/$/^M/'     # Unix to DOS

其中'^M'是control-M字符。你也可以使用bash ANSI-C引用机制来指定回车:

sed $'s/\r$//'     # DOS to Unix
sed $'s/$/\r/'     # Unix to DOS

但是，如果您必须经常这样做(粗略地说，不止一次)，那么安装转换程序(例如dos2unix和unix2dos，或者dou和utod)并使用它们会更明智。

如果你需要处理整个目录和子目录，你可以使用zip:

zip -r -ll zipfile.zip somedir/
unzip zipfile.zip

这将创建一个zip存档，其中行结束符从CRLF更改为cr。unzip将然后将转换后的文件放回原位(并逐个文件询问您-您可以回答:yes to all)。感谢@vmsnomad指出这一点。

2010-04-10 15:13:36

这对我很有效

tr "\r" "\n" < sampledata.csv > sampledata2.csv

2015-03-12 22:36:01

如何将DOS/Windows换行符(CRLF)转换为Unix换行符(LF)

推荐文章

最新文章

标签