C#设置文件编码 C#读写文件时如何指定UTF-8编码

来源：这里教程网时间：2026-02-21 17:41:56 作者：

为什么用

File.WriteAllText

默认不是 UTF-8？

默认情况下，

File.WriteAllText

使用 UTF-8 编码，但**不带 BOM**。问题常出在：某些旧工具（如 Excel、部分 Windows 记事本）把无 BOM 的 UTF-8 当作 ANSI 处理，导致中文乱码。这不是 .NET 的 bug，而是编码识别逻辑差异。

关键点：

File.WriteAllText

重载中不显式传

Encoding

参数时，底层调用的是

Encoding.UTF8

（无 BOM），但你**必须主动传参才能确保行为可预期**。

不传编码参数 → 依赖默认，可能被误读 传
Encoding.UTF8
→ 明确指定，仍为无 BOM 传
new UTF8Encoding(true)
→ 强制写入 BOM（开头三个字节
EF BB BF
）

File.WriteAllText

和

StreamWriter

指定 UTF-8 的区别

两者都能指定编码，但行为细节不同：

File.WriteAllText(path, content, Encoding.UTF8)
：简洁，适合一次性写入；BOM 由
Encoding.UTF8
实例决定（默认 false）
new StreamWriter(path, false, new UTF8Encoding(true))
：更灵活，可控制是否追加、是否写 BOM；
false
表示不追加（覆盖写入）注意：
UTF8Encoding
构造函数第一个 bool 参数是
encoderShouldEmitUTF8Identifier
，即是否写 BOM —— 别和第二个参数（是否只读）搞混

示例：

File.WriteAllText("log.txt", "你好世界", new UTF8Encoding(true)); // 带 BOM
using (var sw = new StreamWriter("data.txt", false, new UTF8Encoding(true)))
{
    sw.Write("测试数据");
}

读取时用

File.ReadAllText

能自动识别 BOM 吗？

能，但仅限于有 BOM 的文件。.NET 的

File.ReadAllText

在未指定编码时，会检查文件开头是否有 UTF-8/UTF-16/UTF-32 BOM，并据此选择解码方式。

文件以
EF BB BF
开头 → 自动用 UTF-8 解码（忽略你传的
Encoding.Default
）没 BOM + 未指定编码 → 回退到
Encoding.Default
（通常是 GBK 或系统本地编码）→ 中文大概率乱码安全做法：读写都显式传相同
Encoding
实例，比如统一用
new UTF8Encoding(true)

错误写法：

File.WriteAllText("a.txt", s); File.ReadAllText("a.txt");

—— 看似一致，实则读取时可能因无 BOM 被当 ANSI 解码。

跨平台读写 UTF-8 文件最稳的组合

Windows 上用记事本、Excel 打开，Linux/macOS 上用命令行工具查看，都要一致显示中文？核心是：**写入带 BOM，读取显式指定带 BOM 的 UTF-8**。

写入：
File.WriteAllText(path, content, new UTF8Encoding(true))
读取：
File.ReadAllText(path, new UTF8Encoding(true))
如果用
StreamReader
，构造时同样传
new UTF8Encoding(true)
，避免它自己探测 BOM 后内部状态不一致注意：BOM 不影响 .NET 内部字符串内容，
string
始终是 UTF-16；BOM 只影响字节流的开头解释

容易被忽略的一点：JSON 或 XML 文件若要求严格无 BOM（比如某些 API 拒绝带 BOM 的请求体），那就必须用