在 C# 中提取 XML 文档中所有文本节点的内容,可以使用 System.Xml 命名空间中的类,如 XDocument 或 XmlDocument。推荐使用 XDocument(LINQ to XML),语法更简洁。
使用 XDocument 提取所有文本节点
以下方法会遍历整个 XML 文档,找到所有文本节点并提取其内容:
示例代码:
// 示例 XML 字符串string xml = @"
25
var doc = XDocument.Parse(xml);
// 提取所有文本节点内容
var textNodes = doc.DescendantNodes()
.OfType
.Select(t => t.Value.Trim())
.Where(value => !string.IsNullOrEmpty(value));
foreach (var text in textNodes)
{
Console.WriteLine(text);
}
输出结果:
张三25
这是一条备注信息。
说明与注意事项
DescendantNodes() 获取所有子节点(包括元素、文本、注释等)
OfType
Value.Trim() 去除首尾空白,避免换行或缩进干扰
Where 过滤空字符串 排除纯空白的文本节点
处理包含 CDATA 的情况
如果 XML 包含 CDATA 节点,比如:
LINQ to XML 会将其作为 XText 节点处理,Value 直接返回 CDATA 内容(即 重要内容),无需特殊处理。
从文件加载 XML
若 XML 存在于文件中,使用:
var doc = XDocument.Load("path/to/file.xml");基本上就这些。使用 LINQ to XML 可以简洁高效地提取所有文本内容,适合大多数场景。
