1.简述
并发通过管理多个任务的执行顺序,确保系统在高负载下仍能保持响应性;并行则利用多处理器或多核心硬件,真正同时执行任务,以加速计算。这两者在高性能计算、实时系统和用户交互应用中发挥着不可替代的作用。
在多核处理器时代,传统串行编程已无法充分利用硬件潜力。并行计算通过将任务分解到多个核心执行,显著缩短了计算时间。然而,并发与并行的实现并非没有代价,它们引入了诸如竞争条件、死锁和负载均衡等复杂问题,需要开发者具备深厚的理论基础和实践经验。
2.并发与并行
2.1 定义
- 并发(Concurrency):
- 指系统在一段时间内管理多个任务的能力。并发关注任务的协调与交错执行,通过时间分片等技术在一个或多个处理器上实现,因此并发看似同时进行,但不一定在同一时刻执行。
- 并发强调任务的逻辑组织和协调。
- 举例:一个Web服务器可以并发处理多个客户端请求,通过快速切换任务确保每个请求都能及时响应。
- 并行(Parallelism):
- 指多个任务在同一时刻真正同时执行,通常依赖于多核处理器或分布式系统。其核心目标是提升计算速度,通过将问题分解为独立的子任务并同时处理。并行适用于计算密集型任务。
- 并行关注物理执行的并行性。
- 举例:在并行矩阵乘法中,不同的核心可以同时计算矩阵的不同部分,从而显著缩短总计算时间;科学模拟或图像处理,其效果依赖于多核处理器、GPU或分布式计算系统的硬件支持。
2.2 区别
并发与并行的根本区别在于执行的时间性和资源依赖性:
- 执行模式:并行强调真正的同时执行,而并发通过任务切换营造同时进行的假象。
- 硬件依赖:并行需要多处理器或多核心支持,而并发在单核系统上即可实现。
- 目标:并行旨在加速计算,而并发注重系统响应性和多任务处理能力。
例如,在单核系统中,操作系统通过时间片轮转调度多个线程;而多核系统中,线程可以分配到不同核心并行运行。
3.实现并发
3.1 并行实现并发
在多核处理器上,任务可以分配到不同核心并行执行,从而实现高效并发。例如,Web服务器通过多线程并行处理客户端请求。
代码示例:多线程并行处理 :System.Threading.ThreadPool来创建和管理线程池,并使用ManualResetEventSlim来等待所有任务完成。- using System;
- using System.Collections.Generic;
- using System.Threading;
- class Program
- {
- static void Main(string[] args)
- {
- List<Request> requests = new List<Request>
- {
- new Request { Data = "Request1" },
- new Request { Data = "Request2" },
- new Request { Data = "Request3" }
- // 添加更多请求
- };
- process_requests(requests);
- Console.WriteLine("All requests processed.");
- }
- static void process_requests(List<Request> requests)
- {
- int num_cores = Environment.ProcessorCount; // 获取处理器核心数
- ManualResetEventSlim[] mres = new ManualResetEventSlim[requests.Count]; // 创建信号量数组
- for (int i = 0; i < requests.Count; i++)
- {
- int index = i;
- mres[index] = new ManualResetEventSlim(false); // 初始化信号量
- ThreadPool.QueueUserWorkItem((state) =>
- {
- handle_request(requests[index]);
- mres[index].Set(); // 任务完成时设置信号量
- });
- }
- // 等待所有任务完成
- ManualResetEventSlim.WaitAll(mres);
- }
- static void handle_request(Request request)
- {
- Response response = process(request); // 处理请求
- send_response(response); // 发送响应
- }
- static Response process(Request request)
- {
- // 模拟请求处理逻辑
- Console.WriteLine($"Processing request: {request.Data}");
- Thread.Sleep(1000); // 模拟耗时操作
- return new Response { Data = $"Response for {request.Data}" };
- }
- static void send_response(Response response)
- {
- // 模拟发送响应逻辑
- Console.WriteLine($"Sending response: {response.Data}");
- }
- }
- class Request
- {
- public string Data { get; set; }
- }
- class Response
- {
- public string Data { get; set; }
- }
复制代码 ======================================================================================================================
使用Task.Run和Task.WhenAll来实现- using System;
- using System.Collections.Generic;
- using System.Threading.Tasks;
- class Program
- {
- static async Task Main(string[] args)
- {
- List<Request> requests = new List<Request>
- {
- new Request { Data = "Request1" },
- new Request { Data = "Request2" },
- new Request { Data = "Request3" }
- // 添加更多请求
- };
- await process_requests(requests);
- Console.WriteLine("All requests processed.");
- }
- static async Task process_requests(List<Request> requests)
- {
- List<Task> tasks = new List<Task>();
- foreach (Request request in requests)
- {
- Task task = Task.Run(() => handle_request(request));
- tasks.Add(task);
- }
- // 等待所有任务完成
- await Task.WhenAll(tasks);
- }
- static async Task handle_request(Request request)
- {
- Response response = await process(request); // 处理请求
- send_response(response); // 发送响应
- }
- static async Task<Response> process(Request request)
- {
- // 模拟请求处理逻辑
- Console.WriteLine($"Processing request: {request.Data}");
- await Task.Delay(1000); // 模拟耗时操作
- return new Response { Data = $"Response for {request.Data}" };
- }
- static void send_response(Response response)
- {
- // 模拟发送响应逻辑
- Console.WriteLine($"Sending response: {response.Data}");
- }
- }
- class Request
- {
- public string Data { get; set; }
- }
- class Response
- {
- public string Data { get; set; }
- }
复制代码 3.2 任务调度
在单核处理器上,通过时间片轮转等调度算法实现并发。操作系统在任务间快速切换,营造同时执行的假象。
代码示例:时间片轮转调度 :示例使用了Task和CancellationToken来管理任务的时间片轮转调度。- using System;
- using System.Collections.Generic;
- using System.Threading;
- using System.Threading.Tasks;
- class Program
- {
- static async Task Main(string[] args)
- {
- List<Task> tasks = new List<Task>
- {
- run_task("Task1", 5000), // 创建一个任务,模拟总时间为5秒
- run_task("Task2", 3000), // 创建一个任务,模拟总时间为3秒
- run_task("Task3", 7000) // 创建一个任务,模拟总时间为7秒
- };
- int time_slice = 1000; // 设置时间片为1秒
- await scheduler(tasks, time_slice);
- Console.WriteLine("All tasks processed.");
- }
- static async Task scheduler(List<Task> tasks, int time_slice)
- {
- List<Task> runningTasks = new List<Task>();
- List<Task> remainingTasks = new List<Task>(tasks);
- while (remainingTasks.Count > 0 || runningTasks.Count > 0)
- {
- // 将剩余任务中的第一个任务移到运行列表
- if (remainingTasks.Count > 0)
- {
- runningTasks.Add(remainingTasks[0]);
- remainingTasks.RemoveAt(0);
- }
- // 复制运行任务列表以避免在遍历过程中修改列表
- List<Task> currentRunningTasks = new List<Task>(runningTasks);
- foreach (Task task in currentRunningTasks)
- {
- if (!task.IsCompleted)
- {
- await run_task_for_time_slice(task, time_slice);
- if (task.IsCompleted)
- {
- runningTasks.Remove(task);
- }
- else
- {
- remainingTasks.Add(task);
- runningTasks.Remove(task);
- }
- }
- }
- }
- }
- static async Task run_task_for_time_slice(Task task, int time_slice)
- {
- // 创建一个取消令牌源
- CancellationTokenSource cts = new CancellationTokenSource(time_slice);
- try
- {
- // 等待任务完成或时间片用完
- await task.WaitAsync(cts.Token);
- }
- catch (TaskCanceledException)
- {
- // 时间片用完,任务未完成
- Console.WriteLine($"Task {task.Id} preempted after {time_slice} ms");
- }
- }
- static Task run_task(string taskName, int total_time)
- {
- return Task.Run(async () =>
- {
- int elapsedTime = 0;
- int time_slice = 1000; // 模拟内部时间片
- while (elapsedTime < total_time)
- {
- Console.WriteLine($"{taskName} is running. Elapsed time: {elapsedTime} ms");
- await Task.Delay(time_slice); // 模拟任务运行一段时间
- elapsedTime += time_slice;
- }
- Console.WriteLine($"{taskName} is completed.");
- });
- }
- }
复制代码 3.3 多线程
多线程通过创建多个执行单元实现并发。线程共享进程资源,通过同步机制(如互斥锁)协调访问。
代码示例:多线程同步- using System;
- using System.Collections.Generic;
- using System.Threading;
- using System.Threading.Tasks;
- namespace Test.EventBus
- {
- public class DemoB
- {
- private static Mutex mutex = new Mutex(); // 创建互斥锁
- private static StringBuilder sharedData = new StringBuilder(); // 初始化共享数据
- public void ShowMsg(string name, string msg)
- {
- Console.WriteLine($"ShowMsg=> name:{name},msg:{msg}");
- var eventMsg = new EventMessage
- {
- Name = name,
- Msg = msg,
- CreatedDate = DateTime.Now
- };
- EventPublishSubscribeUtils.PublishEvent(eventMsg, nameof(DemoB.ShowMsg));
- }
- public static void RunDemo()
- {
- List<Task> tasks = new List<Task>();
- for (int i = 0; i < 10; i++)
- {
- int taskId = i;
- tasks.Add(Task.Run(() => thread_function($"Task{taskId}")));
- }
- // 等待所有任务完成
- Task.WaitAll(tasks);
- }
- static void thread_function(string name)
- {
- for (int i = 0; i < 5; i++)
- {
- modify_shared_data(name, i);
- }
- }
- static void modify_shared_data(string name, int iteration)
- {
- mutex.WaitOne(); // 加锁
- try
- {
- // 修改共享数据
- sharedData.AppendLine($"{name} is modifying shared data at iteration {iteration} on {DateTime.Now}");
- Console.WriteLine($"{name} is modifying shared data at iteration {iteration} on {DateTime.Now}");
- }
- finally
- {
- mutex.ReleaseMutex(); // 解锁
- }
- }
- }
- public class EventMessage
- {
- public string Name { get; set; }
- public string Msg { get; set; }
- public DateTime CreatedDate { get; set; }
- }
- public static class EventPublishSubscribeUtils
- {
- public static void PublishEvent(EventMessage eventMsg, string eventName)
- {
- Console.WriteLine($"Published event: {eventName} => Name: {eventMsg.Name}, Msg: {eventMsg.Msg}, CreatedDate: {eventMsg.CreatedDate}");
- }
- }
- class Program
- {
- static void Main(string[] args)
- {
- DemoB.RunDemo();
- Console.WriteLine("All threads completed.");
- }
- }
- }
复制代码 3.4 异步编程
异步编程通过事件循环和回调函数处理I/O密集型任务,避免阻塞主线程。
代码示例:异步I/O- using System;
- using System.IO;
- using System.Threading.Tasks;
- namespace AsyncIOExample
- {
- class Program
- {
- static async Task Main(string[] args)
- {
- string filePath1 = "example1.txt";
- string filePath2 = "example2.txt";
- // 创建模拟文件
- File.WriteAllText(filePath1, "Data from example1.txt");
- File.WriteAllText(filePath2, "Data from example2.txt");
- // 异步读取文件并使用回调函数处理数据
- await async_read(filePath1, data => callback(data, filePath1));
- await async_read(filePath2, data => callback(data, filePath2));
- Console.WriteLine("All asynchronous read operations completed.");
- }
- static async Task async_read(string file, Action<string> callback)
- {
- // 模拟事件循环添加任务
- Console.WriteLine($"Starting asynchronous read for file: {file}");
- string data = await read_file(file);
- callback(data);
- }
- static async Task<string> read_file(string file)
- {
- // 模拟从磁盘读取文件
- using (StreamReader reader = new StreamReader(file))
- {
- string data = await reader.ReadToEndAsync();
- return data;
- }
- }
- static void callback(string data, string file)
- {
- // 处理读取后的数据
- Console.WriteLine($"Data read from {file}: {data}");
- }
- }
- }
复制代码 3.5 协程
协程通过yield和resume机制在单线程内实现并发,适用于I/O密集型任务,具有低开销优势。
代码示例:协程- using System;
- using System.Collections.Generic;
- using System.Threading.Tasks;
- namespace CoroutineExample
- {
- class Program
- {
- static async Task Main(string[] args)
- {
- IAsyncEnumerable<string> coroutine = coroutine_example();
- // 创建一个异步枚举器
- IAsyncEnumerator<string> enumerator = coroutine.GetAsyncEnumerator();
- // 启动协程
- if (await enumerator.MoveNextAsync())
- {
- Console.WriteLine("Coroutine started.");
- // 发送数据并恢复执行
- await enumerator.MoveNextAsync();
- enumerator.Current = "Data1";
- await enumerator.MoveNextAsync();
- enumerator.Current = "Data2";
- await enumerator.MoveNextAsync();
- enumerator.Current = "Data3";
- // 结束协程
- await enumerator.DisposeAsync();
- }
- }
- static async IAsyncEnumerable<string> coroutine_example()
- {
- string data = null;
- while (true)
- {
- // 暂停并接收数据
- await Task.Delay(100); // 模拟等待
- data = yield return data;
- // 处理数据
- process(data);
- }
- }
- static void process(string data)
- {
- if (data != null)
- {
- Console.WriteLine($"Processed data: {data}");
- }
- else
- {
- Console.WriteLine("No data to process.");
- }
- }
- }
- }
复制代码 3.6 事件驱动
事件驱动编程通过事件循环监听和处理事件,适用于GUI和网络应用。
代码示例:事件驱动3.7 多进程
多进程通过创建独立进程实现并发,进程间通过IPC(如管道或消息队列)通信,适用于CPU密集型任务
在C#中,多进程可以通过使用 System.Diagnostics.Process 类来创建和管理独立进程。进程间通信(IPC)可以通过多种方式实现,例如使用命名管道(System.IO.Pipes)或内存映射文件(System.IO.MemoryMappedFiles)。在这个示例中,我们将使用命名管道来进行进程间通信。
代码示例:多进程- using System;
- using System.Collections.Generic;
- using System.Diagnostics;
- using System.IO.Pipes;
- using System.Text;
- using System.Threading.Tasks;
- namespace MultiProcessExample
- {
- class Program
- {
- static async Task Main(string[] args)
- {
- int num_processes = 3; // 设置进程数量
- List<Process> processes = new List<Process>();
- List<Task<string>> readTasks = new List<Task<string>>();
- // 创建命名管道服务器
- var server = new NamedPipeServerStream("testpipe", PipeDirection.In, num_processes, PipeTransmissionMode.Message, PipeOptions.Asynchronous);
- // 创建并启动进程
- for (int i = 0; i < num_processes; i++)
- {
- Process p = new Process();
- p.StartInfo.FileName = "dotnet";
- p.StartInfo.Arguments = $"MultiProcessExample.dll worker {i}";
- p.StartInfo.UseShellExecute = false;
- p.StartInfo.RedirectStandardOutput = true;
- p.StartInfo.CreateNoWindow = true;
- p.Start();
- processes.Add(p);
- // 读取子进程的输出
- readTasks.Add(Task.Run(() => read_from_process(p)));
- }
- // 等待所有进程结束
- foreach (var process in processes)
- {
- process.WaitForExit();
- }
- // 等待所有读取任务完成
- string[] results = await Task.WhenAll(readTasks);
- // 输出所有结果
- foreach (var result in results)
- {
- Console.WriteLine($"Received result: {result}");
- }
- // 关闭命名管道服务器
- server.Close();
- }
- static string read_from_process(Process process)
- {
- // 读取子进程的标准输出
- string result = process.StandardOutput.ReadToEnd();
- return result;
- }
- }
- class Worker
- {
- static async Task Main(string[] args)
- {
- if (args.Length != 2 || args[0] != "worker" || !int.TryParse(args[1], out int id))
- {
- Console.WriteLine("Invalid arguments.");
- return;
- }
- // 创建命名管道客户端
- using (NamedPipeClientStream pipeClient = new NamedPipeClientStream(".", "testpipe", PipeDirection.Out, PipeOptions.Asynchronous))
- {
- try
- {
- // 连接到命名管道服务器
- await pipeClient.ConnectAsync();
- // 执行计算任务
- string result = compute(id);
- // 发送结果
- send_result(pipeClient, result);
- }
- catch (Exception ex)
- {
- Console.WriteLine($"Error: {ex.Message}");
- }
- }
- }
- static string compute(int id)
- {
- // 模拟计算任务
- Console.WriteLine($"Worker {id} is computing...");
- Task.Delay(1000).Wait(); // 模拟耗时操作
- return $"Result from Worker {id}";
- }
- static void send_result(NamedPipeClientStream pipeClient, string result)
- {
- try
- {
- // 将结果发送到命名管道
- byte[] resultBytes = Encoding.UTF8.GetBytes(result);
- pipeClient.Write(resultBytes, 0, resultBytes.Length);
- pipeClient.Flush();
- }
- catch (Exception ex)
- {
- Console.WriteLine($"Error sending result: {ex.Message}");
- }
- }
- }
- }
复制代码 4.实现并行的技术
4.1 多线程(Multithreading)
多线程通过在单个或多个处理器核心上运行多个线程来实现并行。在多核处理器上,线程可以真正并行执行;在单核处理器上,通过时间片切换实现伪并行。多线程适用于I/O密集型和计算密集型任务,能提高资源利用率和程序响应速度。
代码示例::使用了System.Threading.Thread来创建和管理多个线程,并使用Task来提交和等待任务的完成。- using System;
- using System.Collections.Generic;
- using System.Threading;
- using System.Threading.Tasks;
- namespace MultiThreadExample
- {
- class Program
- {
- static void Main(string[] args)
- {
- int N = 3; // 设置线程数量
- List<Thread> threads = new List<Thread>();
- List<string> results = new List<string>();
- object lockObject = new object(); // 同步锁
- // 创建并启动多个线程
- for (int i = 0; i < N; i++)
- {
- int id = i;
- Thread thread = new Thread(() => task_function(id, results, lockObject));
- threads.Add(thread);
- thread.Start();
- }
- // 等待所有线程完成
- foreach (Thread thread in threads)
- {
- thread.Join();
- }
- // 输出所有结果
- foreach (string result in results)
- {
- Console.WriteLine($"Result from thread: {result}");
- }
- Console.WriteLine("All threads completed.");
- }
- static void task_function(int id, List<string> results, object lockObject)
- {
- string result = perform_task(id); // 执行任务
- lock (lockObject)
- {
- results.Add(result); // 将结果添加到共享列表并加锁
- }
- }
- static string perform_task(int id)
- {
- // 模拟任务执行
- Console.WriteLine($"Thread {id} is processing.");
- Thread.Sleep(1000); // 模拟耗时操作
- return $"Result from Thread {id}";
- }
- }
- }
复制代码 使用 Task 和 async/await 实现:- using System;
- using System.Collections.Generic;
- using System.Threading.Tasks;
- namespace MultiThreadExample
- {
- class Program
- {
- static async Task Main(string[] args)
- {
- int N = 3; // 设置线程数量
- List<Task<string>> tasks = new List<Task<string>>();
- // 创建并启动多个线程
- for (int i = 0; i < N; i++)
- {
- int id = i;
- Task<string> task = Task.Run(() => task_function(id));
- tasks.Add(task);
- }
- // 等待所有线程完成
- string[] results = await Task.WhenAll(tasks);
- // 输出所有结果
- foreach (string result in results)
- {
- Console.WriteLine($"Result from task: {result}");
- }
- Console.WriteLine("All tasks completed.");
- }
- static string task_function(int id)
- {
- string result = perform_task(id); // 执行任务
- return result;
- }
- static string perform_task(int id)
- {
- // 模拟任务执行
- Console.WriteLine($"Task {id} is processing.");
- Task.Delay(1000).Wait(); // 模拟耗时操作
- return $"Result from Task {id}";
- }
- }
- }
复制代码 4.2 多进程(Multiprocessing)
多进程通过创建多个独立进程实现并行,每个进程运行在不同的处理器核心上。进程间通过管道或消息队列等通信机制协调工作。多进程适用于需要高隔离性和安全性的任务,如科学计算和服务器应用。
代码示例::- using System;
- using System.Collections.Generic;
- using System.Diagnostics;
- using System.IO.Pipes;
- using System.Text;
- using System.Threading.Tasks;
- namespace MultiProcessExample
- {
- class Program
- {
- static async Task Main(string[] args)
- {
- int N = 3; // 设置进程数量
- List<Process> processes = new List<Process>();
- List<Task<string>> readTasks = new List<Task<string>>();
- // 创建命名管道服务器
- using (NamedPipeServerStream pipeServer = new NamedPipeServerStream("testpipe", PipeDirection.In, N, PipeTransmissionMode.Message, PipeOptions.Asynchronous))
- {
- // 创建并启动多个进程
- for (int i = 0; i < N; i++)
- {
- Process process = create_process(i);
- processes.Add(process);
- process.Start();
- // 创建一个任务来读取子进程的结果
- readTasks.Add(Task.Run(() => read_from_pipe(pipeServer)));
- }
- // 等待所有进程完成
- foreach (var process in processes)
- {
- process.WaitForExit();
- }
- // 等待所有读取任务完成
- string[] results = await Task.WhenAll(readTasks);
- // 输出所有结果
- foreach (var result in results)
- {
- Console.WriteLine($"Received result: {result}");
- }
- // 关闭命名管道服务器
- pipeServer.Close();
- }
- Console.WriteLine("All processes completed.");
- }
- static Process create_process(int id)
- {
- Process process = new Process();
- process.StartInfo.FileName = "dotnet";
- process.StartInfo.Arguments = $"MultiProcessExample.dll worker {id}";
- process.StartInfo.UseShellExecute = false;
- process.StartInfo.RedirectStandardOutput = true;
- process.StartInfo.CreateNoWindow = true;
- return process;
- }
- static async Task<string> read_from_pipe(NamedPipeServerStream pipeServer)
- {
- // 等待客户端连接
- await pipeServer.WaitForConnectionAsync();
- // 创建字节数组来接收数据
- byte[] buffer = new byte[1024];
- int bytesRead = await pipeServer.ReadAsync(buffer, 0, buffer.Length);
- string result = Encoding.UTF8.GetString(buffer, 0, bytesRead);
- // 断开连接
- pipeServer.Disconnect();
- return result;
- }
- }
- }
复制代码 **使用Worker类:
**- using System;
- using System.IO.Pipes;
- using System.Threading.Tasks;
- namespace MultiProcessExample
- {
- class Worker
- {
- static async Task Main(string[] args)
- {
- if (args.Length != 2 || args[0] != "worker" || !int.TryParse(args[1], out int id))
- {
- Console.WriteLine("Invalid arguments.");
- return;
- }
- // 创建命名管道客户端
- using (NamedPipeClientStream pipeClient = new NamedPipeClientStream(".", "testpipe", PipeDirection.Out, PipeOptions.Asynchronous))
- {
- try
- {
- // 连接到命名管道服务器
- await pipeClient.ConnectAsync();
- // 执行计算任务
- string result = compute(id);
- // 发送结果
- send_result(pipeClient, result);
- }
- catch (Exception ex)
- {
- Console.WriteLine($"Error: {ex.Message}");
- }
- }
- }
- static string compute(int id)
- {
- // 模拟计算任务
- Console.WriteLine($"Worker {id} is computing...");
- Task.Delay(1000).Wait(); // 模拟耗时操作
- return $"Result from Worker {id}";
- }
- static void send_result(NamedPipeClientStream pipeClient, string result)
- {
- try
- {
- // 将结果发送到命名管道
- byte[] resultBytes = Encoding.UTF8.GetBytes(result);
- pipeClient.Write(resultBytes, 0, resultBytes.Length);
- pipeClient.Flush();
- }
- catch (Exception ex)
- {
- Console.WriteLine($"Error sending result: {ex.Message}");
- }
- }
- }
- }
复制代码 4.3 分布式计算(Distributed Computing)
分布式计算将任务分配到网络中的多台计算机上并行执行,通常使用消息传递接口(MPI)进行通信。适用于大规模数据处理和复杂计算任务,如天气预报和分布式数据库。
为了简化实现,我们可以使用一个简单的消息传递库,例如 NamedPipes 和 Task 来模拟MPI的行为。这里我们使用 NamedPipes 来进行进程间通信,并模拟主节点和工作节点之间的数据交换。
代码示例:- using System;
- using System.Collections.Generic;
- using System.Diagnostics;
- using System.IO.Pipes;
- using System.Text;
- using System.Threading.Tasks;
- namespace DistributedComputingExample
- {
- class Program
- {
- static async Task Main(string[] args)
- {
- int num_workers = 3; // 设置工作节点数量
- List<Process> workers = new List<Process>();
- List<Task<string>> readTasks = new List<Task<string>>();
- // 创建和启动工作节点
- for (int i = 1; i <= num_workers; i++)
- {
- Process worker = create_worker_process(i);
- workers.Add(worker);
- worker.Start();
- }
- // 模拟主节点
- if (args.Length == 0 || args[0] != "worker")
- {
- // 主节点逻辑
- string data = load_data(num_workers);
- Console.WriteLine("Data loaded.");
- // 创建命名管道服务器来发送数据
- List<NamedPipeServerStream> sendPipes = new List<NamedPipeServerStream>();
- for (int i = 1; i <= num_workers; i++)
- {
- NamedPipeServerStream sendPipe = new NamedPipeServerStream($"sendpipe_{i}", PipeDirection.Out, 1, PipeTransmissionMode.Message, PipeOptions.Asynchronous);
- sendPipes.Add(sendPipe);
- }
- // 发送数据到每个工作节点
- for (int i = 1; i <= num_workers; i++)
- {
- string data_chunk = data.Split('|')[i - 1];
- send_data(sendPipes[i - 1], data_chunk);
- }
- // 创建命名管道服务器来接收结果
- List<NamedPipeServerStream> receivePipes = new List<NamedPipeServerStream>();
- for (int i = 1; i <= num_workers; i++)
- {
- NamedPipeServerStream receivePipe = new NamedPipeServerStream($"receivepipe_{i}", PipeDirection.In, 1, PipeTransmissionMode.Message, PipeOptions.Asynchronous);
- receivePipes.Add(receivePipe);
- }
- // 读取每个工作节点的结果
- for (int i = 1; i <= num_workers; i++)
- {
- readTasks.Add(Task.Run(() => read_from_pipe(receivePipes[i - 1])));
- }
- // 等待所有工作节点完成
- foreach (var worker in workers)
- {
- worker.WaitForExit();
- }
- // 等待所有读取任务完成
- string[] results = await Task.WhenAll(readTasks);
- // 聚合结果
- string final_result = aggregate(results);
- Console.WriteLine($"Final result: {final_result}");
- }
- else
- {
- // 工作节点逻辑
- int id = int.Parse(args[1]);
- Console.WriteLine($"Worker {id} started.");
- // 创建命名管道客户端来接收数据
- using (NamedPipeClientStream receivePipe = new NamedPipeClientStream(".", $"sendpipe_{id}", PipeDirection.In, PipeOptions.Asynchronous))
- {
- await receivePipe.ConnectAsync();
- string data_chunk = receive_data(receivePipe);
- Console.WriteLine($"Worker {id} received data: {data_chunk}");
- // 处理数据
- string result = process(data_chunk);
- Console.WriteLine($"Worker {id} processed data: {result}");
- // 创建命名管道客户端来发送结果
- using (NamedPipeClientStream sendPipe = new NamedPipeClientStream(".", $"receivepipe_{id}", PipeDirection.Out, PipeOptions.Asynchronous))
- {
- await sendPipe.ConnectAsync();
- send_result(sendPipe, result);
- }
- }
- }
- }
- static Process create_worker_process(int id)
- {
- Process process = new Process();
- process.StartInfo.FileName = "dotnet";
- process.StartInfo.Arguments = $"DistributedComputingExample.dll worker {id}";
- process.StartInfo.UseShellExecute = false;
- process.StartInfo.RedirectStandardOutput = true;
- process.StartInfo.CreateNoWindow = true;
- return process;
- }
- static string load_data(int num_chunks)
- {
- // 模拟加载数据
- string data = "DataChunk1|DataChunk2|DataChunk3";
- return data;
- }
- static void send_data(NamedPipeServerStream pipe, string data)
- {
- try
- {
- byte[] dataBytes = Encoding.UTF8.GetBytes(data);
- pipe.Write(dataBytes, 0, dataBytes.Length);
- pipe.Flush();
- pipe.Disconnect();
- }
- catch (Exception ex)
- {
- Console.WriteLine($"Error sending data: {ex.Message}");
- }
- }
- static string receive_data(NamedPipeClientStream pipe)
- {
- try
- {
- byte[] buffer = new byte[1024];
- int bytesRead = pipe.Read(buffer, 0, buffer.Length);
- return Encoding.UTF8.GetString(buffer, 0, bytesRead);
- }
- catch (Exception ex)
- {
- Console.WriteLine($"Error receiving data: {ex.Message}");
- return null;
- }
- }
- static string process(string data_chunk)
- {
- // 模拟任务处理
- Console.WriteLine($"Processing data chunk: {data_chunk}");
- Task.Delay(1000).Wait(); // 模拟耗时操作
- return $"Processed {data_chunk}";
- }
- static void send_result(NamedPipeClientStream pipe, string result)
- {
- try
- {
- byte[] resultBytes = Encoding.UTF8.GetBytes(result);
- pipe.Write(resultBytes, 0, resultBytes.Length);
- pipe.Flush();
- }
- catch (Exception ex)
- {
- Console.WriteLine($"Error sending result: {ex.Message}");
- }
- }
- static async Task<string> read_from_pipe(NamedPipeServerStream pipe)
- {
- await pipe.WaitForConnectionAsync();
- byte[] buffer = new byte[1024];
- int bytesRead = await pipe.ReadAsync(buffer, 0, buffer.Length);
- string result = Encoding.UTF8.GetString(buffer, 0, bytesRead);
- pipe.Disconnect();
- return result;
- }
- static string aggregate(string[] results)
- {
- // 聚合结果
- StringBuilder finalResult = new StringBuilder();
- foreach (string result in results)
- {
- finalResult.AppendLine(result);
- }
- return finalResult.ToString();
- }
- }
- }
复制代码 5 实践运用
5.1 软件开发中的并行应用
并行广泛应用于需要高计算能力的场景,包括:
- 科学模拟:天气预报、分子动力学等任务涉及大量方程求解,可通过并行化显著加速。
- 机器学习:深度神经网络训练依赖矩阵运算,TensorFlow和PyTorch等框架利用GPU并行性加速训练过程。
- 图像与视频处理:如3D渲染或视频滤镜应用,可将任务分配到多核或GPU上并行执行。
常见的并行编程模型包括:
- T- PL:TPL是.NET中用于并行编程的一个强大库
- OpenMP:基于指令的共享内存并行API,适用于C/C++和Fortran。
- MPI(消息传递接口):分布式内存并行的标准,用于高性能计算集群。
- CUDA:NVIDIA的并行计算平台,支持GPU上的细粒度并行。
5.2 软件开发中的并发应用
并发在需要处理多任务或事件的系统中至关重要,例如:
- Web服务器:如Apache和Nginx,通过多线程、多进程或事件驱动架构并发处理大量客户端请求。
- 图形用户界面(GUI):并发确保界面在执行后台任务(如数据加载)时仍能响应用户输入。
- 数据库系统:通过锁和事务等并发控制机制,管理多用户对数据的并发访问。
常见的并发模型包括:
- 多线程:C#、Java和C++提供线程库(如System.Thread、java.lang.Thread、std::thread)实现并发。
- 异步编程:Node.js和Python的asyncio支持非阻塞代码,适用于I/O密集型任务。
- Actor模型:Erlang和Akka框架通过独立的Actor单元和消息传递实现并发,避免共享内存问题。
6. 并发与并行编程的挑战
6.1 并发挑战
并发引入了多个复杂问题:
- 竞争条件(Race Conditions):多个线程同时访问共享资源,可能导致不可预测的结果。例如,未同步的计数器递增可能丢失更新。
- 死锁(Deadlocks):线程间相互等待对方释放资源,导致永久阻塞。例如,两个线程各自持有对方需要的锁。
- 活锁(Livelocks):线程不断尝试解决问题但无进展,如反复让出资源。
- 饥饿(Starvation):某些线程因调度不公而无法获得资源。
解决这些问题通常依赖同步原语(如互斥锁、信号量),但过度同步可能降低性能。
6.2 并行挑战
并行计算也有其难点:
- 负载均衡:确保所有处理器或核心均匀分担工作量,避免部分核心空闲。
- 通信开销:分布式系统中,节点间通信成本可能抵消并行收益。
- 可扩展性:随着处理器数量增加,同步开销或串行部分可能导致收益递减。
并行算法需精心设计,采用动态负载均衡或工作窃取等技术应对这些挑战。
7. 管理并行与并发的工具与技术
7.1 调试与测试
并发与并行程序的非确定性使其调试异常困难,常用工具包括:
- 静态分析:如Intel Inspector或FindBugs,可在不运行代码的情况下检测潜在问题。
- 运行时验证:Valgrind的Helgrind等工具在程序运行时监控同步错误。
- 测试框架:JUnit或pytest可扩展用于并发测试,模拟多线程场景。
7.2 设计模式
设计模式为常见问题提供解决方案:
- 线程池:管理固定数量的线程执行任务,减少创建和销毁开销。
- 生产者-消费者:生产者生成数据,消费者处理数据,通过同步队列协调。
- Map-Reduce:将任务映射到数据分片并归约结果,适用于大数据处理。
7.3 编程语言支持
现代语言内置了对并行与并发的支持:
- CSharp:通过TPL和System.Collections.Concurrent等库简化并发和并行编程。
- Go:通过goroutines和通道简化并发编程。
- Rust:通过所有权模型在编译时防止数据竞争。
- Java:提供java.util.concurrent包,包括线程池、并发集合等高级工具。
8.并行与并发的权衡
8.1 复杂度与性能
并行与并发提升性能的同时增加了代码复杂度:
- 多线程:提供细粒度控制,但易引入竞争条件。
- 异步编程:避免线程开销,但可能导致回调地狱或复杂逻辑。
8.2 共享内存与消息传递
并发模型分为两种:
- 共享内存:线程共享数据,需同步以避免冲突,效率高但易出错。
- 消息传递:通过消息通信避免共享状态,安全性高但可能引入延迟。
如何选择取决于性能、安全性和应用需求。
来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作! |