用 TextFieldParser
读 CSV 更安全,别手写字符串分割
手动
Split(',') 会崩在带逗号、换行、引号的字段上(比如地址字段 "Beijing, China"或多行备注)。.NET 自带的
Microsoft.VisualBasic.FileIO.TextFieldParser能正确处理转义和引号包裹,即使项目是 C# 也能用——只需引用
Microsoft.VisualBasic程序集(.NET Core/.NET 5+ 已内置,无需额外 NuGet)。
常见错误:漏掉
SetDelimiters(",") 或没设 HasFieldsEnclosedInQuotes = true,导致解析失败或字段错位。 必须调用
parser.SetDelimiters(","),否则默认按制表符分隔
含引号字段(如 "John ""The Boss"" Doe")需开启
HasFieldsEnclosedInQuotes = true遇到空行或注释行,检查
parser.CommentTokens和
parser.TextFieldType
using Microsoft.VisualBasic.FileIO;
// ...
using (var parser = new TextFieldParser("data.csv"))
{
parser.SetDelimiters(",");
parser.HasFieldsEnclosedInQuotes = true;
while (!parser.EndOfData)
{
string[] fields = parser.ReadFields();
Console.WriteLine(string.Join("|", fields));
}
}写 CSV 用 StreamWriter
+ 手动转义,别直接 WriteLine
没有内置“一键写 CSV”的 API。直接
sw.WriteLine(string.Join(",", values)) 在值含逗号、引号或换行时会破坏格式。必须对每个字段做 RFC 4180 兼容转义:字段含 ,、
"或
\n时,用双引号包裹,并将内部引号替换成两个引号(
"→
"")。
性能提示:不要为每行都新建
StreamWriter;打开一次,循环写入。 空字段或含特殊字符的字段必须加双引号 字段内引号必须变成两个引号(不是反斜杠转义) 避免用
Encoding.Default,显式指定
Encoding.UTF8防止中文乱码
using (var sw = new StreamWriter("output.csv", false, Encoding.UTF8))
{
foreach (var row in data)
{
var escaped = row.Select(field =>
{
if (string.IsNullOrEmpty(field) || field.IndexOfAny(new char[] { ',', '"', '\n', '\r' }) == -1)
return field;
return $"\"{field.Replace("\"", "\"\"")}\"";
});
sw.WriteLine(string.Join(",", escaped));
}
}第三方库选 CsvHelper
,但注意配置陷阱
CsvHelper是最常用的 C# CSV 库,支持类型映射、自动转义、自定义分隔符。但它默认不处理 BOM,且对 null 值、空字符串、日期格式敏感,容易导出后 Excel 打不开或数据错列。
典型问题:用
GetRecords<t>()</t>读取时字段名大小写不匹配、类型转换失败抛异常;写入时没设
ShouldQuote导致引号丢失。 读取前务必调用
csv.Configuration.Delimiter = ","和
csv.Configuration.HasHeaderRecord = true写入时启用 BOM:
new StreamWriter("out.csv", false, Encoding.UTF8)(CsvWriter不自动加) 字段含换行符?确保
csv.Configuration.ShouldQuote = args => true强制所有字段加引号
Excel 打不开 CSV?大概率是编码或 BOM 问题
Windows 上 Excel 默认用系统本地编码(如 GB2312)打开 CSV,UTF-8 无 BOM 的文件常显示乱码。这不是 CSV 格式错,而是编码声明缺失。
解决方法只有两个:要么保存为 UTF-8 with BOM,要么改用 ANSI 编码(不推荐,中文易损)。
写文件时用new UTF8Encoding(true)(
true表示写 BOM) 别依赖
Encoding.UTF8默认构造函数——它不写 BOM 用记事本另存为“UTF-8”时,实际写的是带 BOM 的 UTF-8;VS 或代码里不用这个构造,Excel 就认不出
var bomUtf8 = new UTF8Encoding(true); // 注意这个 true
using (var sw = new StreamWriter("excel-friendly.csv", false, bomUtf8))
{
// ... 写内容
}BOM 和字段转义是绝大多数人卡住的地方,不是语法不会,是不知道 Excel 和 RFC 对“合法 CSV”的要求比直觉严格得多。
