获取Windows中文件的编码

这不是一个真正的编程问题，是否有命令行或Windows工具(Windows 7)来获取文本文件的当前编码?当然，我可以写一个小c#应用程序，但我想知道是否有一些已经内置?

当前回答

使用Windows自带的普通记事本打开文件。当你点击“另存为…”时，它会显示文件的编码。它看起来是这样的:

无论默认选择的编码是什么，这就是文件的当前编码。如果它是UTF-8，您可以将其更改为ANSI并单击保存以更改编码(或visa-反之)。

我知道有许多不同类型的编码，但当我被告知我们的导出文件是UTF-8，他们需要ANSI时，这就是我所需要的。这是一个一次性的输出，所以记事本适合我。

供参考:根据我的理解，我认为“Unicode”(如在记事本中列出的)是UTF-16的虚名。更多关于记事本的“Unicode”选项:Windows 7 - UTF-8和Unicdoe

2012-11-20 00:27:03

其他回答

以下是我对如何通过BOM检测Unicode文本编码家族的看法。这种方法的准确性很低，因为这种方法只适用于文本文件(特别是Unicode文件)，并且在没有BOM时默认为ascii(像大多数文本编辑器一样，如果你想匹配HTTP/web生态系统，默认将是UTF8)。

2018年更新:我不再推荐这种方法。我建议使用GIT中的file.exe或@Sybren推荐的*nix工具，我将在后面的回答中展示如何通过PowerShell来实现这一点。

# from https://gist.github.com/zommarin/1480974
function Get-FileEncoding($Path) {
    $bytes = [byte[]](Get-Content $Path -Encoding byte -ReadCount 4 -TotalCount 4)

    if(!$bytes) { return 'utf8' }

    switch -regex ('{0:x2}{1:x2}{2:x2}{3:x2}' -f $bytes[0],$bytes[1],$bytes[2],$bytes[3]) {
        '^efbbbf'   { return 'utf8' }
        '^2b2f76'   { return 'utf7' }
        '^fffe'     { return 'unicode' }
        '^feff'     { return 'bigendianunicode' }
        '^0000feff' { return 'utf32' }
        default     { return 'ascii' }
    }
}

dir ~\Documents\WindowsPowershell -File | 
    select Name,@{Name='Encoding';Expression={Get-FileEncoding $_.FullName}} | 
    ft -AutoSize

建议:如果dir、ls或Get-ChildItem只检查已知的文本文件，并且只从已知的工具列表中寻找“糟糕的编码”，那么这个方法可以很好地工作。(例如SQL Management Studio默认为UTF16，这破坏了GIT auto-cr-lf for Windows，这是多年来的默认。)

2015-01-22 00:02:08

如果你的Windows机器上有“git”或“Cygwin”，然后转到文件所在的文件夹并执行命令:

file *

这将为您提供该文件夹中所有文件的编码细节。

2017-04-19 07:37:36

您可以在文件位置上打开git bash，然后运行命令file -i file_name来检查

例子

user filesData
$ file -i data.csv
data.csv: text/csv; charset=utf-8

2022-02-23 14:04:52

我发现做到这一点的唯一方法是VIM或notepad++。

2017-09-14 15:49:44

一个简单的解决方案可能是在Firefox中打开该文件。

将文件拖放到firefox中按Ctrl+I打开页面信息

和文本编码将出现在“页面信息”窗口。

注意:如果文件不是txt格式，请将其重命名为txt，然后重试。

附:欲了解更多信息，请参阅这篇文章。

2019-08-08 17:37:28

获取Windows中文件的编码

推荐文章

最新文章

标签