这是我的连接设置: Connection conn = DriverManager。getConnection(url + dbName + "?useUnicode=true&characterEncoding=utf-8",用户名,密码);

我得到以下错误时轮胎添加一行到一个表: 错误的字符串值:'\xF0\x90\x8D\x83\xF0\x90…在第1行为“content”列

我插入数千条记录,当文本包含\xF0时,我总是得到这个错误(即不正确的字符串值总是以\xF0开始)。

列的排序规则是utf8_general_ci。

有什么问题吗?


当前回答

您需要在元html和服务器alter表中设置utf8mb4,并将collation设置为utf8mb4

其他回答

我的解决方案是将列类型从varchar(255)更改为blob

这主要是由一些unicode字符引起的。对我来说,它是卢比的货币符号。

为了快速修复这个问题,我必须找出导致这个错误的字符。我把整个文本复制粘贴到一个文本编辑器中,比如vi,然后用一个文本替换掉麻烦的字符。

我还必须删除并重新创建数据库的所有存储过程(以及函数),以便它们在utf8mb4的新字符集中执行。

Run:

SHOW PROCEDURE STATUS;

查看哪些过程没有更新到服务器的新的character_set_client、collation_connection和Database Collation值。

包含\xF0的字符串只是使用UTF-8编码为多个字节的字符。

尽管您的排序规则设置为utf8_general_ci,但我怀疑数据库、表甚至列的字符编码可能不同。它们是独立的设置。试一试:

ALTER TABLE database.table MODIFY COLUMN col VARCHAR(255)  
    CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci NOT NULL;

将实际数据类型替换为VARCHAR(255)

删除模式并使用utf8mb4字符集重新创建它解决了我的问题。