C# 如何高效读取超大xml文件

来源：这里教程网时间：2026-02-21 17:29:13 作者：

处理超大 XML 文件时，使用常规的 XDocument 或 XmlDocument 会将整个文件加载到内存中，容易导致内存溢出。C# 中高效读取超大 XML 文件的推荐方式是使用 XmlReader，它以流式方式逐节点读取，内存占用极低。

使用 XmlReader 流式读取

XmlReader 是只进、只读的流式解析器，适合处理 GB 级别的 XML 文件。

示例：读取大型 XML 中的特定元素

假设有一个如下结构的大型 XML 文件：

<Root>
  <Record Id="1"><Name>Alice</Name></Record>
  <Record Id="2"><Name>Bob</Name></Record>
  ...
</Root>

使用 XmlReader 提取所有 Record 节点中的 Name 值：

using (var reader = XmlReader.Create("hugefile.xml"))
{
    while (reader.Read())
    {
        if (reader.IsStartElement("Record"))
        {
            string id = reader["Id"]; // 读取属性
            reader.Read(); // 进入子节点
            if (reader.IsStartElement("Name"))
            {
                string name = reader.ReadElementContentAsString();
                Console.WriteLine($"Id: {id}, Name: {name}");
            }
        }
    }
}

这种方式不会加载整个文档，仅在需要时读取当前节点。

按需解析复杂结构

若 XML 结构较深，可结合 ReadSubtree 将某个节点下的子树交给独立的 reader 处理。

示例：提取子树进行局部解析

当遇到目标节点时，使用 ReadSubtree() 创建子阅读器，便于用其他方式（如 XNode）解析局部内容。

if (reader.IsStartElement("Record"))
{
    using (var subtree = reader.ReadSubtree())
    {
        var element = XNode.ReadFrom(subtree) as XElement;
        // 使用 LINQ to XML 处理该节点
        Console.WriteLine(element?.Element("Name")?.Value);
    }
}

注意：仅对较小的子节点使用此方式，避免破坏流式处理优势。

性能优化建议

设置 XmlReaderSettings 关闭不必要的功能，如 DTD 解析、命名空间支持（如果不需要） 使用 ConformanceLevel.Fragment 如果读取的是 XML 片段 避免在循环中创建大量临时对象，尽量复用变量 考虑分批处理或并行处理多个文件（非单个大文件内部并行）