C#解析并修改XML后保存 如何确保格式与编码的正确性

来源:这里教程网 时间:2026-02-21 17:31:57 作者:

在C#中解析、修改并保存XML时,确保格式和编码的正确性需要关注XML文档的声明、缩进、字符编码以及写入方式。使用 XmlDocumentXDocument 配合正确的设置可以有效控制输出质量。

1. 使用 XmlDocument 保持格式与编码

XmlDocument 支持保留原始格式,并可通过 XmlWriter 精确控制输出。关键在于设置 XmlWriterSettings

启用
Indent = true
实现良好缩进
指定
Encoding
(如 UTF-8)避免乱码
设置
CloseOutput = true
确保流正确关闭

示例代码:

XmlDocument doc = new XmlDocument();
doc.Load("input.xml");
// 修改内容
XmlNode node = doc.SelectSingleNode("//name");
if (node != null)
    node.InnerText = "张三";
// 使用 XmlWriter 保存,控制格式与编码
XmlWriterSettings settings = new XmlWriterSettings
{
    Indent = true,
    IndentChars = "  ",
    Encoding = new UTF8Encoding(false), // 不带 BOM 的 UTF-8
    NewLineChars = "\n"
};
using (XmlWriter writer = XmlWriter.Create("output.xml", settings))
{
    doc.Save(writer);
}

2. 使用 XDocument(LINQ to XML)的注意事项

XDocument 默认输出会自动格式化,但编码控制需依赖 Save 方法中的 XmlWriter

直接调用
doc.Save(path)
会使用 UTF-8(无 BOM)并自动缩进
若需带 BOM 或其他编码,必须使用 XmlWriter

示例:

XDocument doc = XDocument.Load("input.xml");
doc.Root?.Element("name")?.SetValue("李四");
// 自定义编码输出
using (var writer = XmlWriter.Create("output.xml", new XmlWriterSettings
{
    Indent = true,
    Encoding = Encoding.UTF8
}))
{
    doc.Save(writer);
}

3. 关键细节:BOM 与换行符控制

Windows 下常因 BOM 或换行符导致兼容性问题:

使用
new UTF8Encoding(false)
可避免生成 BOM
设置
NewLineChars = "\n"
统一为 LF,避免 Windows 的 CRLF 影响脚本处理
原始 XML 声明中的编码应与实际写入一致,否则可能被工具误判

4. 验证输出一致性

建议在保存后重新加载文件验证:

检查是否能再次解析 比对关键节点内容是否正确 用文本编辑器查看编码和缩进是否符合预期

例如:

// 验证保存结果
XDocument test = XDocument.Load("output.xml");
Console.WriteLine(test.Declaration?.Encoding); // 应为 utf-8
基本上就这些。只要在保存时明确使用 XmlWriterSettings 控制缩进、编码和换行,就能确保修改后的 XML 格式整洁、编码正确,避免常见问题。

相关推荐