我有一个非常简单的东西,它只是输出一些CSV格式的东西,但它必须是UTF-8。我在TextEdit或TextMate或Dreamweaver中打开这个文件,它会正确地显示UTF-8字符,但如果我在Excel中打开它,它会做这种愚蠢的íÄ之类的事情。下面是我在我的文档头部得到的内容:

header("content-type:application/csv;charset=UTF-8");
header("Content-Disposition:attachment;filename=\"CHS.csv\"");

这一切似乎都达到了预期的效果,除了Excel (Mac, 2008)不想正确地导入它。Excel里没有“以UTF-8格式打开”之类的选项,所以……我有点烦了。

我似乎在任何地方都找不到任何明确的解决方案,尽管很多人都有同样的问题。我看到的最多的事情是包括BOM,但我不知道如何做到这一点。正如你所看到的,我只是回显这些数据,我没有写入任何文件。如果我需要,我可以这样做,我只是没有因为在这一点上似乎不需要这样做。任何帮助吗?

更新:我尝试将BOM作为回显包(“CCC”,0xef, 0xbb, 0xbf);这是我刚刚从一个试图检测BOM的网站上找到的。但Excel只是在导入时将这三个字符附加到第一个单元格,仍然会把特殊字符弄乱。


当前回答

当我调查时,我发现UTF-8在MAC和Windows上工作得不好,所以我尝试了Windows-1252,它在两者上都支持得很好,但你必须在ubuntu上选择编码类型。 下面是我的代码$valueToWrite = mb_convert_encoding($value, 'Windows-1252');

$response->headers->set('Content-Type', $mime . '; charset=Windows-1252');
    $response->headers->set('Pragma', 'public');
    $response->headers->set('Content-Endcoding','Windows-1252');
    $response->headers->set('Cache-Control', 'maxage=1');
    $response->headers->set('Content-Disposition', $dispositionHeader);
    echo "\xEF\xBB\xBF"; // UTF-8 BOM

其他回答

不需要使用mb_convert_encoding转换已经经过utf-8编码的文本。只需要在原来的内容前面加上三个字:

$newContent = chr(239) . chr(187) . chr(191) . $originalContent

对我来说,这解决了csv文件中特殊字符的问题。

我用了这个,很管用

header('Content-Description: File Transfer');
header('Content-Type: text/csv; charset=UTF-16LE');
header('Content-Disposition: attachment; filename=file.csv');
header('Content-Transfer-Encoding: binary');
header('Expires: 0');
header('Cache-Control: must-revalidate, post-check=0, pre-check=0');
header('Pragma: public');
// output headers so that the file is downloaded rather than displayed
// create a file pointer connected to the output stream
$output = fopen('php://output', 'w');
fputs( $output, "\xEF\xBB\xBF" );
// output the column headings
fputcsv($output, array('Thông tin khách hàng đăng ký'));
// fetch the data
$setutf8 = "SET NAMES utf8";
$q = $conn->query($setutf8);
$setutf8c = "SET character_set_results = 'utf8', character_set_client =
'utf8', character_set_connection = 'utf8', character_set_database = 'utf8',
character_set_server = 'utf8'";
$qc = $conn->query($setutf8c);
$setutf9 = "SET CHARACTER SET utf8";
$q1 = $conn->query($setutf9);
$setutf7 = "SET COLLATION_CONNECTION = 'utf8_general_ci'";
$q2 = $conn->query($setutf7);
$sql = "SELECT id, name, email FROM myguests";
$rows = $conn->query($sql);
$arr1= array();
if ($rows->num_rows > 0) {
// output data of each row
while($row = $rows->fetch_assoc()) {
    $rcontent = " Name: " . $row["name"]. " - Email: " . $row["email"];  
    $arr1[]["title"] =  $rcontent;
}
} else {
     echo "0 results";
}
$conn->close();
// loop over the rows, outputting them
foreach($arr1 as $result1):
   fputcsv($output, $result1);
endforeach;

引用微软技术支持工程师的话,

Excel for Mac目前不支持UTF-8

2017年更新:这适用于Office 2016之前的所有版本的Microsoft Excel for Mac。更新的版本(来自Office 365)现在支持UTF-8。

为了输出在Windows和OS X上的Excel都能够成功读取的UTF-8内容,您将需要做两件事:

确保您将UTF-8 CSV文本转换为UTF-16LE mb_convert_encoding($csv, 'UTF-16LE', 'UTF-8'); 确保在文件的开头添加了UTF-16LE字节顺序标记 科(255)。科(254)

下一个问题只出现在Excel在OS X(但不是Windows)将是当查看一个以逗号分隔值的CSV文件时,Excel将只呈现一行的行,所有的文本与第一行的逗号一起。

避免这种情况的方法是使用制表符作为分离的值。

我从PHP注释中使用了这个函数(使用制表符“\t”而不是逗号),它在OS X和Windows Excel上完美地工作。

注意,要修复一个空列作为一行结束的问题,我必须改变代码行,它说:

    $field_cnt = count($fields);

to

    $field_cnt = count($fields)-1;

正如本页上的其他一些评论所说,其他电子表格应用程序,如OpenOffice Calc,苹果自己的Numbers和谷歌Doc的spreadsheet,对带有逗号的UTF-8文件没有任何问题。

请参阅此问题中的表格,了解在Excel中哪些适用于Unicode CSV文件,哪些不适用


作为旁注,我可能会补充一点,如果你正在使用Composer,你应该看看如何将League\Csv添加到你的需求中。League\Csv有一个非常好的API来构建Csv文件。

要使用League\Csv创建Csv文件的这种方法,请查看这个示例

当我调查时,我发现UTF-8在MAC和Windows上工作得不好,所以我尝试了Windows-1252,它在两者上都支持得很好,但你必须在ubuntu上选择编码类型。 下面是我的代码$valueToWrite = mb_convert_encoding($value, 'Windows-1252');

$response->headers->set('Content-Type', $mime . '; charset=Windows-1252');
    $response->headers->set('Pragma', 'public');
    $response->headers->set('Content-Endcoding','Windows-1252');
    $response->headers->set('Cache-Control', 'maxage=1');
    $response->headers->set('Content-Disposition', $dispositionHeader);
    echo "\xEF\xBB\xBF"; // UTF-8 BOM

CSV文件必须包含字节顺序标记。

或者像建议的那样,使用HTTP正文进行回显