第四讲多线程Pthread编程

共享内存系统和分布式内存模型回顾

伪共享

cache按照行读取
当多个处理器访问同一行，即使访问的是不同的机器字，也会潜在竞争
会产生不必要的协同开销
1. 当数据很少的时候，Core1和Core0访问的是同一行，同一个缓存行里的不同变量在同时被修改

共享内存编程

动态线程
1. 主线程等待计算工作，fork新线程分配工作，工作线程完成任务后结束
2. 资源利用率高
主线程完成时fork出所有线程
1. 性能更优，但可能浪费系统资源

并行程序设计的复杂性

POSIX Threads编程

基本概念

线程库：

Pthread是POSIX标准
- 相对底层
- 可移植
OpenMP是新标准
- 高层编程，适用于共享内存架构上的科学计算

POSIX Thread

基础API

创建线程

int pthread_create(pthread_t*,const pthread_attr_t*,void*(*)(void*),void*)
  
  //pthread_t不透明，程序员不可操作
  
//调用
errcode=pthread_create(&thread_id,&thread_attribute,&thread_fun,&fun_arg);

thread_id
- 指针：线程ID或句柄（用于停止线程）
thread_attribute:
- 各种属性，通常用空指针NULL表示标准默认属性值
thread_fun
- 新线程要运行的函数（参数和返回值类型都是void*）
fun_arg
- 传递给要运行的函数thread_fun的参数
errorocode
- 若创建失败，返回非零值

![image-20221031151330065](/Users/zhangxiaoni/Library/Application Support/typora-user-images/image-20221031151330065.png)

Pthread “hello world”程序

![image-20221031152746925](/Users/zhangxiaoni/Library/Application Support/typora-user-images/image-20221031152746925.png)

#include<stdio.h>
#include<stdlib.h>
#include<pthread.h>
 
int thread_count;

void* Hello(void* rank)

int main(int argc,char* argv[]){
  long thread;
  pthread_t* thread_handles;
  
  thread_count=strto(argv[1],NULL,10);
  
  thread_handles=(pthread_t*)malloc(thread_count*sizeof(pthread_t*));
  
  for(thread=0;thread<thread_count;thread++)
 pthread_create(&thread_handles[thread],NULL,Hello,(void*)thread);
  
  printf("Hello from the main thread\n");
  
  for(thread=0;thread<thread_count;thread++);
  pthread_join(thread_handles[thread],NULL);
  
  free(thread_handles);
  return 0;
}