我如何确定文件编码在OS X?

我试图在TextMate中输入一些UTF-8字符到LaTeX文件(它说它的默认编码是UTF-8)，但LaTeX似乎不理解它们。

运行cat my_file.tex可以在Terminal中正确显示字符。运行ls -al会显示一些我以前从未见过的东西:文件列表旁边的“@”:

-rw-r--r--@  1 me      users      2021 Feb 11 18:05 my_file.tex

(并且，是的，我在LaTeX中使用\usepackage[utf8]{inputenc}。)

我找到了iconv，但这似乎不能告诉我编码是什么-它只会转换一旦我弄清楚。

当前回答

你也可以使用下面的命令从一个文件类型转换到另一个文件类型:

iconv -f original_charset -t new_charset originalfile > newfile

如。

iconv -f utf-16le -t utf-8 file1.txt > file2.txt

其他回答

@表示该文件具有与之相关的扩展文件属性。您可以使用getxattr()函数查询它们。

没有确定的方法来检测文件的编码。阅读这个答案，它解释了为什么。

有一个命令行工具enca，它尝试猜测编码。你可能会想去看看。

Synalyze它!允许比较ICU库提供的所有编码中的文本或字节。使用该功能，您通常会立即看到哪个代码页对您的数据有意义。

在file命令上使用-I(大写i)选项似乎可以显示文件编码。

file -I {filename}

在Mac OS X中，命令文件-I(大写i)将为您提供适当的字符集，只要您正在测试的文件包含基本ASCII范围之外的字符。

例如，如果你进入终端，使用vi来创建一个文件。vi用法然后插入一些字符，包括一个重音字符(尝试ALT-e后面跟着e) 然后保存文件。

他们输入file -I text.txt，你应该得到这样的结果:

用法:文本/平原;utf - 8字符集=

你用的是哪种乳胶?当我使用teTeX时，我必须手动下载unicode包，并将其添加到我的.tex文件中:

% UTF-8 stuff
\usepackage[notipa]{ucs}
\usepackage[utf8x]{inputenc}
\usepackage[T1]{fontenc}

现在，我已经从TeXlive 2008包切换到XeTeX(这里)，它甚至更简单:

% UTF-8 stuff
\usepackage{fontspec}
\usepackage{xunicode}

至于检测文件的编码，您可以使用file(1)(但它相当有限)，但就像其他人所说的那样，这很困难。

推荐文章