我有一个“ñ”字符的字符串,我有一些问题。我需要将这个字符串编码为UTF-8编码。我试过这种方法,但行不通:

byte ptext[] = myString.getBytes();
String value = new String(ptext, "UTF-8");

如何将该字符串编码为utf-8?


当前回答

如何配置NetBeans默认编码UTF-8的快速分步指南。结果NetBeans将创建UTF-8编码的所有新文件。

NetBeans默认编码UTF-8分步指南

进入NetBeans安装目录下的etc文件夹 编辑netbeans.conf文件 找到netbeans_default_options行 添加-J-Dfile。encoding=UTF-8在这一行的引号内 (例如:netbeans_default_options =“-J-Dfile.encoding = utf - 8”) 重启NetBeans

设置NetBeans默认编码UTF-8。

您的netbeans_default_options可能在引号内包含其他参数。在这种情况下,添加-J-Dfile。encoding=UTF-8在字符串的末尾。用空格将其与其他参数分隔开。

例子:

netbeans_default_options="-J-client -J-Xss128m -J-Xms256m . -J-Dapple.laf -J-XX: PermSize = 32米。useScreenMenuBar = true -J-Dapple.awt.graphics。UseQuartz = true -J-Dsun.java2d。noddraw = true -J-Dsun.java2d。dpiaware = true -J-Dsun.zip。disableMemoryMapping = true -J-Dfile.encoding = utf - 8”

这里是进一步详细信息的链接

其他回答

在Java7中,你可以使用:

import static java.nio.charset.StandardCharsets.*;

byte[] ptext = myString.getBytes(ISO_8859_1); 
String value = new String(ptext, UTF_8); 

这比getBytes(String)有优势,它不声明抛出UnsupportedEncodingException。

如果你使用的是旧版本的Java,你可以自己声明字符集常量:

import java.nio.charset.Charset;

public class StandardCharsets {
    public static final Charset ISO_8859_1 = Charset.forName("ISO-8859-1");
    public static final Charset UTF_8 = Charset.forName("UTF-8");
    //....
}

Java String在内部总是用UTF-16编码——但是你真的应该这样想:编码是一种在字符串和字节之间转换的方式。

如果你有编码问题,当你有字符串的时候,就来不及修正了。您需要修复从文件、DB或网络连接中创建字符串的位置。

使用byte[] ptext = String.getBytes("UTF-8");而不是getBytes()。getBytes()使用所谓的“默认编码”,可能不是UTF-8。

String value = new String(myString.getBytes("UTF-8"));

并且,如果您想从“ISO-8859-1”编码的文本文件中读取:

String line;
String f = "C:\\MyPath\\MyFile.txt";
try {
    BufferedReader br = Files.newBufferedReader(Paths.get(f), Charset.forName("ISO-8859-1"));
    while ((line = br.readLine()) != null) {
        System.out.println(new String(line.getBytes("UTF-8")));
    }
} catch (IOException ex) {
    //...
}

怎么使用呢?

ByteBuffer byteBuffer = StandardCharsets.UTF_8.encode(myString)