C# 操作mbox邮件文件 C#如何读取和解析传统的Unix邮箱格式

来源：这里教程网时间：2026-02-21 17:43:06 作者：

用

MailKit

解析 mbox 文件最靠谱

直接上结论：别自己手写解析器，

MailKit

是目前 C# 生态里唯一稳定支持完整 mbox 格式的开源库。它能正确处理多封邮件拼接、

From

行边界、时间戳乱码、编码混用等坑点。

常见错误现象是用

StreamReader

按行读取后简单切分

From

行，结果遇到带附件的邮件或含

From

字样的正文就断错位置——mbox 规范要求只有行首独立的

From

（注意末尾空格）才是分隔符，且后面必须紧跟时间戳。

MailKit
内部用状态机识别真实分隔符，跳过邮件体内的干扰文本支持自动检测
Content-Transfer-Encoding
和
charset
，避免中文乱码 不依赖系统本地化设置，Windows/macOS/Linux 行为一致

mbox 文件路径和编码必须显式指定

很多失败案例源于默认编码误判。

StreamReader

用 UTF-8 BOM 判断编码，但绝大多数 mbox 文件无 BOM，且实际是 ISO-8859-1 或 GBK 编码的原始 Unix 邮件存档。

使用

MailKit

时，

MboxReader

构造函数必须传入

Encoding

参数：

using (var reader = new MboxReader("inbox.mbox", Encoding.GetEncoding("iso-8859-1")))
{
    while (reader.TryReadMessage(out var message))
    {
        Console.WriteLine(message.Subject);
    }
}

Unix 系统导出的老 mbox 多为
iso-8859-1
；中文环境可能是
gb2312
或
gbk
若不确定编码，先用
file -i inbox.mbox
（Linux/macOS）或
chardet
工具探测别用
Encoding.Default
——它在 Windows 上是 GBK，在 Linux 容器里可能是 UTF-8，行为不可控

提取邮件头和正文要区分

TextBody

和

HtmlBody

MimeMessage

的

TextBody

不是“纯文本内容”，而是自动降级后的首选文本体。它会按

text/plain

→

text/html

→ 其他 text/* 类型顺序选取，且已解码（base64/QP）并转码为 .NET 字符串。

常见误区是直接读

message.Body

，结果拿到的是原始 MIME 结构对象，不是可读字符串。

需要纯文本内容：优先用
message.TextBody
，它已处理换行、编码、字符集转换需要 HTML 渲染：用
message.HtmlBody
，注意可能含相对路径引用的内嵌资源要访问原始未解码数据（比如调试编码问题）：遍历
message.BodyParts
手动找
TextPart
并调用
GetBodyAsText()