Parallel.ForEach 为什么比 foreach 快,但有时反而更慢?
因为
Parallel.ForEach会自动拆分数据、分配线程、合并结果,省去手动管理
Task的开销;但若迭代体执行时间极短(比如只做一次
i++),线程调度和同步的开销会远超计算收益。 适合场景:每个迭代项耗时 ≥ 几毫秒,且无强顺序依赖(如批量文件处理、HTTP 请求、图像像素计算) 不适用场景:循环体仅含简单算术、或需严格按索引顺序写入同一数组/集合 注意默认线程数受
ThreadPool限制,高并发小任务建议用
ParallelOptions.MaxDegreeOfParallelism控制
如何安全地在 Parallel.ForEach 中更新共享变量?
直接读写普通变量(如
int count = 0)会导致竞态——多个线程同时执行
count++可能只加 1 次。必须用线程安全方式: 用
Interlocked.Increment(ref count)替代
count++(整数类计数首选) 对集合操作,改用线程安全类型:如
ConcurrentBag<t></t>、
ConcurrentQueue<t></t>,而非
List<t></t>若逻辑复杂,用
lock(obj)包裹临界区,但粒度要小,避免锁住整个循环体
Parallel.For 和 Parallel.ForEach 的关键参数差异
两者都支持
ParallelOptions,但循环结构不同导致行为差异明显:
Parallel.For(0, data.Length, i => { ... }):索引驱动,适合需要下标访问数组/列表的场景,但不能直接用 data[i]做越界检查(i 由框架分配,可能跳变)
Parallel.ForEach(data, item => { ... }):元素驱动,代码更直观,但无法直接获知当前索引(除非传入 Parallel.ForEach(data.AsParallel().Select((x,i)=>new{x,i}), ...),但已脱离原生 Parallel范畴) 两者都可通过
ParallelLoopState.Break()提前退出,但
Break()不会立即终止所有线程,后续分区仍可能执行
常见错误:AggregateException 被吞掉,实际异常没被发现
Parallel方法内部抛出的异常会被包装成
AggregateException,若不显式处理,可能静默失败或只暴露第一个 InnerException:
try
{
Parallel.ForEach(items, item =>
{
if (item == null) throw new ArgumentNullException(nameof(item));
Process(item);
});
}
catch (AggregateException ex)
{
// 必须遍历 InnerExceptions 才能看到所有错误
foreach (var inner in ex.InnerExceptions)
{
Console.WriteLine(inner.Message);
}
}
更稳妥的做法是用
ex.Flatten().InnerExceptions展平嵌套,并注意:只要有一个线程抛异常,整个并行操作就会中止(除非用
ParallelOptions.CancellationToken配合手动恢复逻辑)。
别忘了,调试并行代码时,VS 的“并行堆栈”窗口比普通调用栈更有用;而
Thread.Sleep在循环体里是性能毒药,它会让线程池误判负载,拖慢整体吞吐。
