.NET中的任务并行库(TPL)是System.Threading.Tasks命名空间下的一组API,旨在简化多线程和并行编程。它通过抽象底层线程管理,让开发者更专注于任务逻辑而非线程控制。TPL的核心是Task类,它代表一个异步操作,能自动利用线程池资源,提升应用程序的响应性和性能。
Parallel类的作用
Parallel类是TPL的一部分,提供静态方法来实现数据并行处理。最常用的是Parallel.For和Parallel.ForEach,它们可以将循环体的工作分配到多个线程中执行,适用于独立迭代的场景。
使用Parallel.For加速数值计算
当你需要对大量数值进行独立计算时,比如数组元素处理,Parallel.For比传统的for循环更快。
示例:并行计算数组平方
int[] numbers = Enumerable.Range(0, 10000).ToArray();
int[] squares = new int[numbers.Length];
<p>Parallel.For(0, numbers.Length, i =>
{
squares[i] = numbers[i] * numbers[i];
});
这段代码将0到9999每个数的平方并行计算并存入新数组,充分利用CPU多核能力。
使用Parallel.ForEach处理集合
对于IEnumerable类型的集合,使用Parallel.ForEach更合适。
示例:并行处理文件列表
var files = Directory.GetFiles("C:\Documents", "*.txt");
<p>Parallel.ForEach(files, file =>
{
var content = File.ReadAllText(file);
// 做一些独立处理,如统计字数
Console.WriteLine($"{file}: {content.Length} characters");
});
每个文件读取和处理在不同线程中进行,显著缩短总耗时。
注意事项与最佳实践
虽然Parallel类能提升性能,但并非所有场景都适用。
迭代之间必须无依赖关系,否则会出现竞争条件 细粒度操作可能因线程调度开销反而变慢 共享变量需加锁保护,如使用lock或Interlocked 可传入ParallelOptions控制最大并发数例如限制最大线程数:
Parallel.ForEach(data, new ParallelOptions { MaxDegreeOfParallelism = 4 }, item =>
{
// 处理逻辑
});
基本上就这些。合理使用Parallel类能在数据密集型场景中显著提升效率,关键是确保任务独立且工作量足够大以抵消并行开销。
