一、线程介绍
什么是线程:
线程是操作系统能内够进行运算、执行的最小单位,它被包含在进程之中,是进程中的实际运作单位。一条线程指的是进程中一个单一顺序的控制流,一个进程中可以并发多个线程,每条线程并行执行不同的任务。
总结:线程是进程的一部分,是进程内负责执行的单位,进程是由资源单位(内存资源、信号处理方案、文件表)+执行单位组成,默认情况下进程内只有一个线程,但可以有多个。
线程的发展简史:
60年代,在操作系统中能拥有资源和独立运行的基本单位是进程。
随着计算机技术的发展,进程出现了很多弊端:
一是由于进程是资源拥有者,创建、撤消与切换存在较大的时间开销,因此需要引入轻型进程;
二是由于对称多处理机出现,可以满足多个运行单位,而多个进程并行开销过大。
因此在80年代,出现了能独立运行的基本单位——线程(Threads)。
线程的调度策略:
线程是独立调度和分派的基本单位,有三种不同的调试策略:
1、线程可以为操作系统内核调度的内核线程,如Win32线程;
2、由用户进行自行调度的用户线程,如Linux、UNIX平台的POSIX Thread;
3、由内核与用户进程进行混合调度,如Windows 7的线程。
多线程适用的范围:
一个进程可以有很多线程,每条线程并行执行不同的任务。 在多核或多CPU,或支持Hyper-threading的CPU上使用多线程程序设计的好处是显而易见,即提高了程序的执行吞吐率。
在单CPU单核的计算机上,使用多线程技术,可以把进程中负责I/O处理、人机交互而常被阻塞的部分与密集计算的部分分开来执行,原因就是线程占用的资源少,被阻塞时不浪费资源。
线程的特点:
轻型实体:
线程中的实体基本上不拥有系统资源,只是有一点必不可少的、能保证独立运行的资源。线程的实体包括用于指示被执行指令序列的程序计数器、局部变量、状态参数和返回地址。
线程是动态概念,它的动态特性由线程控制块TCB(Thread Control Block)描述,包括以下信息:
1、线程状态
2、当线程不运行时,被保存的现场资源。
3、一组执行堆栈
4、存放每个线程的局部变量主存区
5、访问同一个进程中的主存和其它资源
独立调度和分派的基本单位:
在多线程OS中,线程是能独立运行的基本单位,因而也是独立调度和分派的基本单位。由于线程很“轻”,故线程的切换非常迅速且开销小(在同一进程中的)。
可并发执行:
在一个进程中的多个线程之间,可以并发执行,甚至允许在一个进程中所有线程都能并发执行;同样,不同进程中的线程也能并发执行,充分利用和发挥了CPU与外围设备并行工作的能力。
共享进程资源:
在同一进程中的各个线程,都可以访问该进程的用户空间,此外,还可以访问进程所拥有的已打开文件、定时器、信号量等,线程可以共享该进程所拥有的资源。所以线程之间互相通信不必调用内核。
二、线程与进程的区别(多进程与多线程)
资源:
进程采用虚拟空间+用户态/内核态机制,所以就导致进程与进程之间是互相独立的,各自的资源不可见。
在同一进程中的各个线程都可以共享该进程所拥有的资源。
多进程之间资源是独立的,多线程之间资源是共享的。
通信:
由于进程之间是互相独立的,需要使用各种IPC通信机制,保障多个进程协同工作。
同一进程中的各个线程共享该进程所拥有的资源,线程间可以直接读写进程数据段来进行通信,但需要线程同步和互斥手段的辅助,以保证数据的一致性。
多进程之间资源是独立的,所以需要通信,多线程之间资源是共享的,所以需要同步和互斥。
调度:
无论系统采用什么样的线程调试策略,线程上下文切换都比进程上下文切换要快得多。
身份:
进程是个资源单位,线程是个执行单位,并且线程是进程的一部分,线程需要进程安身立命,进程也需要线程当牛做马。
三、POSIX线程库
POSIX线程库介绍:
POSIX线程(POSIX Threads,常被缩写为pthread)是POSIX的线程标准,定义了创建和操纵线程的一套API。 实现POSIX 线程标准的库常被称作pthread,一般用于Unix-likePOSIX 系统,如Linux、Solaris。但是Microsoft Windows上的实现也存在,例如直接使用Windows API实现的第三方库pthread-w32。
API具体内容:
pthread定义了一套C语言的类型、函数与常量,它以pthread.h头文件和一个接口库libpthread.so,gcc和g++编译器没有默认链接该库,需要程序员使用 -l pthread 参数进行手动链接。
pthread API中大致共有100个函数调用,全都以"pthread_"开头,并可以分为四类:
1、线程管理,如创建线程,等待线程,查询线程状态等。
2、互斥锁,有创建、摧毁、锁定、解锁、设置属性等操作
3、条件变量,有创建、摧毁、等待、通知、设置与查询属性等操作
4、使用了互斥锁的线程间的同步管理。
四、创建线程
int pthread_create (pthread_t* thread, const pthread_attr_t* attr, void* (*start_routine) (void*), void* arg); thread - 线程ID,输出型参数。我们目前使用的Linux中pthread_t即unsigned long int attr - 线程属性,NULL表示缺省属性,如果没有特殊需求,一般写NULL即可 start_routine - 线程入口函数指针,参数和返回值的类型都是void* 启动线程本质上就是调用一个函数,只不过是在一个独立的线程中调用的,函数返回即线程结束 arg - 传递给线程过程函数的参数 返回值:成功返回0,失败返回错误码,但不会修改全局的错误变量,也就是无法使用perror获取错误原因。 注意: 1、restrict: C99引入的编译优化指示符,提高重复解引用同一个指针的效率。 2、应设法保证在线程过程函数执行期间,其参数所指向的目标持久有效。
#include <stdio.h> #include <unistd.h> #include <pthread.h> void* run(void* arg) { for(;;) { printf("#"); fflush(stdout); sleep(1); } } int main(int argc,const char* argv[]) { pthread_t tid; int ret = pthread_create(&tid,NULL,run,NULL); printf("%d %lu\n",ret,tid); for(;;) { printf("*"); fflush(stdout); sleep(1); } return 0; }
五、线程回收
int pthread_join (pthread_t thread, void** retval); 功能:等待thread参数所标识的线程结束,并回收相关资源,如果thread线程没有结束则阻塞 retval:获得线程正常结束时的返回值,是输出型的参数,用于获取线程入口函数的返回值。 返回值:成功返回0,失败返回错误码 从线程过程函数中返回值的方法: 1、线程过程函数将所需返回的内容放在一块内存中,返回该内存块的首地址,保证这块内存在函数返回,即线程结束,以后依然有效; 2、若retval参数非NULL,则pthread_join函数将线程入口函数所返回的指针,拷贝到该参数所指向的内存中; 3、线程入口函数所返回的指针指向text、data、bss内存段的数据,如果指向heap内存段,则还需保证在用过该内存之后释放之。
六、获取线程ID、判断线程ID
pthread_t pthread_self (void); 成功返回调用线程的ID,不会失败。 int pthread_equal (pthread_t t1, pthread_t t2); 功能:若参数t1和t2所标识的线程ID相等,则返回非零,否则返回0。 注意:某些实现的pthread_t不是unsigned long int类型,可能是结构体类型,无法通过“==”判断其相等性。
七、终止线程
方法1:从线程入口函数中return,主线程除外。
方法2:调用pthread_exit函数。
void pthread_exit (void* retval); retval - 和线程过程函数的返回值语义相同。
注意:在任何线程中调用exit函数都将终止整个进程。
问题:主线程结束,子线程是否会跟着一起结束?
主线程结束,并不会导致子线程跟着一起结束,它们之间没有必然联系。
但是,主线程如果执行到最后一行,会执行return 0或隐藏的return 0,而在main函数中执行return 0就相当于执行exit(0),然后当前进程就会结束,有两种方法可以避免这种情况:
方法1:
等待所有子线程结束,主线程再执行return 0;
子线程在一定时间内会结束,侧使用pthread_join。
方法2:
立即结束主线程,不要让它执行return 0;
当子线程的结束时间不确定,则使用pthread_exit。
注意:这种情况会产生新的问题,子线程的资源没有办法回收。
#include <stdio.h> #include <pthread.h> #include <unistd.h> void* run(void* arg) { for(int i=0; ;i++) { printf("子线程:%lu %d\n",pthread_self(),i); sleep(1); } } int main(void) { pthread_t tid; pthread_create(&tid,NULL,run,NULL); for(int i=0; i<3; i++) { printf("我是主线程,我要结束了,倒计时:%d\n",3-i); sleep(1); } exit }
八、线程分离
同步方式(非分离状态):创建线程之后主线程调用pthread_join函数等待其终止,并释放线程资源。
异步方式(分离状态):无需创建者等待,线程终止后自行释放资源。
int pthread_detach (pthread_t thread); 功能:使thread参数所标识的线程进入分离(DETACHED)状态。 返回值:成功返回0,失败返回错误码。
注意:如果若干个子线程需要长时间执行,不知道什么时候能结束,为了避免它父线程陷入无尽的等待,可提前给子线程设置分离状态。
九、取消线程
向发送取消请求:
int pthread_cancel (pthread_t thread); 功能:该函数只是向线程发出取消请求,并不等待线程终止。 缺省情况下,线程在收到取消请求以后,并不会立即终止,而是仍继续运行,直到其达到某个取消点。 在取消点处,线程检查其自身是否已被取消了,并做出相应动作。
设置可取消状态:
int pthread_setcancelstate (int state,int* oldstate); 成功返回0,并通过oldstate参数输出原可取消状态(若非NULL),失败返回错误码。 state取值: PTHREAD_CANCEL_ENABLE - 接受取消请求(缺省)。 PTHREAD_CANCEL_DISABLE - 忽略取消请求。
设置可取消类型:
int pthread_setcanceltype (int type, int* oldtype); 成功返回0,并通过oldtype参数输出原可取消类型 (若非NULL),失败返回错误码。 type取值: PTHREAD_CANCEL_DEFERRED - 延迟取消(缺省)。 被取消线程在接收到取消请求之后并不立即响应, 而是一直等到执行了特定的函数(取消点)之后再响应该请求。 PTHREAD_CANCEL_ASYNCHRONOUS - 异步取消。 被取消线程可以在任意时间取消,不是非得遇到取消点才能被取消。 但是操作系统并不能保证这一点。
十、线程属性
int pthread_create (pthread_t* restrict thread, const pthread_attr_t* restrict attr, void* (*start_routine) (void*), void* restrict arg); //创建线程函数的第二个参数即为线程属性,传空指针表示使用缺省属性。 typedef struct { // 分离状态 int detachstate; // PTHREAD_CREATE_DETACHED - 分离线程。 // PTHREAD_CREATE_JOINABLE(缺省) - 可汇合线程。 // 竞争范围 int scope; // PTHREAD_SCOPE_SYSTEM - 在系统范围内竞争资源(时间片)。 // PTHREAD_SCOPE_PROCESS(Linux不支持) - 在进程范围内竞争资源。 // 继承特性 int inheritsched; // PTHREAD_INHERIT_SCHED(缺省) - 调度属性自创建者线程继承。 // PTHREAD_EXPLICIT_SCHED - 调度属性由后面两个成员确定。 // 调度策略 nt schedpolicy; // SCHED_FIFO - 先进先出策略。 // 没有时间片。 // 一个FIFO线程会持续运行,直到阻塞或有高优先级线程就绪。 // 当FIFO线程阻塞时,系统将其移出就绪队列,待其恢复时再加到同优先级就绪队列的末尾。 // 当FIFO线程被高优先级线程抢占时,它在就绪队列中的位置不变。 // 因此一旦高优先级线程终止或阻塞,被抢占的FIFO线程将会立即继续运行。 // SCHED_RR - 轮转策略。 // 给每个RR线程分配一个时间片,一但RR线程的时间片耗尽,系统即将移到就绪队列的末尾。 // SCHED_OTHER(缺省) - 普通策略。 // 静态优先级为0。任何就绪的FIFO线程或RR线程,都会抢占此类线程。 // 调度参数 struct sched_param schedparam; // struct sched_param { // int sched_priority; /* 静态优先级 */ // }; // 栈尾警戒区大小(字节) 缺省一页(4096字节)。 size_t guardsize; // 栈地址 void* stackaddr; // 栈大小(字节) size_t stacksize; } pthread_attr_t; 注意:不要手动读写该结构体,而应调用pthread_attr_set/get函数设置/获取具体属性项。
设置线程属性:
初始化线程属性结构体:
pthread_attr_t attr = {}; // 不要使用这种方式 int pthread_attr_init (pthread_attr_t* attr);
设置具体线程属性项:
int pthread_attr_setdetachstate (pthread_attr_t* attr,int detachstate); int pthread_attr_setscope (pthread_attr_t* attr,int scope); int pthread_attr_setinheritsched (pthread_attr_t* attr,int inheritsched); int pthread_attr_setschedpolicy (pthread_attr_t* attr,int policy); int pthread_attr_setschedparam (pthread_attr_t* attr,const struct sched_param* param); int pthread_attr_setguardsize (pthread_attr_t* attr,size_t guardsize); int pthread_attr_setstackaddr (pthread_attr_t* attr,void* stackaddr); int pthread_attr_setstacksize (pthread_attr_t* attr,size_t stacksize); int pthread_attr_setstack (pthread_attr_t* attr,void* stackaddr, size_t stacksize);
以设置好的线程属性结构体为参数创建线程:
int pthread_create (pthread_t* restrict thread, const pthread_attr_t* testrict attr, void* (*start_routine) (void*), void* restrict arg);
销毁线程属性结构体:
int pthread_attr_destroy (pthread_attr_t* attr);
获取线程属性:
获取线程属性结构体:
int pthread_getattr_np (pthread_t thread,pthread_attr_t* attr);
获取具体线程属性项:
int pthread_attr_getdetachstate (pthread_attr_t* attr,int* detachstate); int pthread_attr_getscope (pthread_attr_t* attr,int* scope); int pthread_attr_getinheritsched (pthread_attr_t* attr,int* inheritsched); int pthread_attr_getschedpolicy (pthread_attr_t* attr,int* policy); int pthread_attr_getschedparam (pthread_attr_t* attr,struct sched_param* param); int pthread_attr_getguardsize (pthread_attr_t* attr,size_t* guardsize); int pthread_attr_getstackaddr (pthread_attr_t* attr,void** stackaddr); int pthread_attr_getstacksize (pthread_attr_t* attr,size_t* stacksize); int pthread_attr_getstack (pthread_attr_t* attr,void** stackaddr, size_t* stacksize); 以上所有函数成功返回0,失败返回错误码。
#include <stdio.h> #include <stdlib.h> #include <string.h> #include <unistd.h> #define __USE_GNU #include <pthread.h> int printattrs (pthread_attr_t* attr) { printf("------- 线程属性 -------\n"); int detachstate; int error = pthread_attr_getdetachstate (attr, &detachstate); if (error) { fprintf (stderr, "pthread_attr_getdetachstate: %s\n",strerror (error)); return -1; } printf("分离状态: %s\n", (detachstate == PTHREAD_CREATE_DETACHED) ? "分离线程" : (detachstate == PTHREAD_CREATE_JOINABLE) ? "可汇合线程" : "未知"); int scope; if ((error = pthread_attr_getscope (attr, &scope)) != 0) { fprintf (stderr, "pthread_attr_getscope: %s\n", strerror (error)); return -1; } printf ("竞争范围: %s\n", (scope == PTHREAD_SCOPE_SYSTEM) ? "系统级竞争" : (scope == PTHREAD_SCOPE_PROCESS) ? "进程级竞争" : "未知"); int inheritsched; if ((error = pthread_attr_getinheritsched (attr, &inheritsched)) != 0) { fprintf (stderr, "pthread_attr_getinheritsched: %s\n", strerror (error)); return -1; } printf ("继承特性: %s\n", (inheritsched == PTHREAD_INHERIT_SCHED) ? "继承调用属性" : (inheritsched == PTHREAD_EXPLICIT_SCHED) ? "显式调用属性" : "未知"); int schedpolicy; if ((error = pthread_attr_getschedpolicy(attr,&schedpolicy)) != 0) { fprintf (stderr, "pthread_attr_getschedpolicy: %s\n",strerror (error)); return -1; } printf ("调度策略: %s\n", (schedpolicy == SCHED_OTHER) ? "普通" : (schedpolicy == SCHED_FIFO) ? "先进先出" : (schedpolicy == SCHED_RR) ? "轮转" : "未知"); struct sched_param schedparam; if ((error = pthread_attr_getschedparam (attr, &schedparam)) != 0) { fprintf (stderr, "pthread_attr_getschedparam: %s\n",strerror (error)); return -1; } printf ("调度优先级:%d\n", schedparam.sched_priority); size_t guardsize; if ((error = pthread_attr_getguardsize(attr, &guardsize)) != 0) { fprintf (stderr, "pthread_attr_getguardsize: %s\n",strerror (error)); return -1; } printf ("栈尾警戒区:%u字节\n", guardsize); /* void* stackaddr; if ((error = pthread_attr_getstackaddr (attr, &stackaddr)) != 0) { fprintf (stderr, "pthread_attr_getstackaddr: %s\n",strerror (error)); return -1; } printf ("栈地址: %p\n", stackaddr); size_t stacksize; if ((error = pthread_attr_getstacksize (attr, &stacksize)) != 0) { fprintf (stderr, "pthread_attr_getstacksize: %s\n",strerror (error)); return -1; } printf ("栈大小: %u字节\n", stacksize); */ void* stackaddr; size_t stacksize; if ((error = pthread_attr_getstack (attr, &stackaddr,&stacksize)) != 0) { fprintf (stderr, "pthread_attr_getstack: %s\n",strerror (error)); return -1; } printf ("栈地址: %p\n", stackaddr); printf ("栈大小: %u字节\n", stacksize); printf("------------------------\n"); return 0; } void* thread_proc (void* arg) { pthread_attr_t attr; int error = pthread_getattr_np (pthread_self (), &attr); if (error) { fprintf (stderr, "pthread_getattr_np: %s\n", strerror (error)); exit (EXIT_FAILURE); } if (printattrs (&attr) < 0) exit (EXIT_FAILURE); exit (EXIT_SUCCESS); return NULL; } int main (int argc, char* argv[]) { int error; pthread_attr_t attr, *pattr = NULL; if (argc > 1) { if (strcmp (argv[1], "-s")) { fprintf (stderr, "用法:%s [-s]\n", argv[0]); return -1; } if ((error = pthread_attr_init (&attr)) != 0) { fprintf (stderr, "pthread_attr_init: %s\n",strerror (error)); return -1; } if ((error = pthread_attr_setdetachstate (&attr,PTHREAD_CREATE_DETACHED)) != 0) { fprintf (stderr, "pthread_attr_setdetachstate: %s\n",strerror (error)); return -1; } if ((error = pthread_attr_setinheritsched (&attr,PTHREAD_EXPLICIT_SCHED)) != 0) { fprintf (stderr, "pthread_attr_setinheritsched: %s\n",strerror (error)); return -1; } if ((error = pthread_attr_setstacksize (&attr, 4096*10)) != 0) { fprintf (stderr, "pthread_attr_setstack: %s\n",strerror (error)); return -1; } pattr = &attr; } pthread_t tid; if ((error = pthread_create (&tid, pattr, thread_proc,NULL)) != 0) { fprintf (stderr, "pthread_create: %s\n", strerror (error)); return -1; } if (pattr) { if ((error = pthread_attr_destroy (pattr)) != 0) { fprintf (stderr, "pthread_attr_destroy: %s\n",strerror (error)); return -1; } } pause (); return 0; }
注意:如果man手册查不到线程的相关函数,安装完整版gnu手册:sudo apt-get install glibc-doc。
练习:实现大文件的多线程cp拷贝,对比系统cp命令,哪个速度更快,为什么?
#include <stdio.h> #include <stdlib.h> #include <unistd.h> #include <pthread.h> #include <sys/stat.h> #include <sys/types.h> typedef struct Task { char* src; char* dest; size_t start; size_t end; }Task; void* run(void* arg) { Task* task = arg; // 打开源文件和目标文件 FILE* src_fp = fopen(task->src,"r"); FILE* dest_fp = fopen(task->dest,"a"); if(NULL == src_fp || NULL == dest_fp) { perror("fopen"); return NULL; } // 调整文件的位置指针 fseek(src_fp,task->start,SEEK_SET); fseek(dest_fp,task->start,SEEK_SET); // 创建缓冲区 char buf[1024]; size_t buf_size = sizeof(buf); for(int i=task->start; i<task->end; i+=buf_size) { int ret = fread(buf,1,buf_size,src_fp); if(0 >= ret) break; fwrite(buf,1,ret,dest_fp); } fclose(src_fp); fclose(dest_fp); free(task); } int main(int argc,const char* argv[]) { if(3 != argc) { puts("Use:./cp <src> <dest>"); return 0; } // 获取到文件的大小 struct stat buf; if(stat(argv[1],&buf)) { perror("stat"); return -1; } // 创建出目标文件 if(NULL == fopen(argv[2],"w")) { perror("fopen"); return -2; } // 计算需要的线程数量,以100M为单位 size_t pthread_cnt = buf.st_size/(1024*1024*100)+1; // 分配任务 pthread_t tid; for(int i=0; i<pthread_cnt; i++) { Task* task = malloc(sizeof(Task)); task->src = (char*)argv[1]; task->dest = (char*)argv[2]; task->start = i*1024*1024*100; task->end = (i+1)*1024*1024*100; // 创建子线程并分配任务 pthread_create(&tid,NULL,run,task); // 分享子线程 pthread_detach(tid); } // 结束主线程 pthread_exit(NULL); }
多线程并不能提高运行速度,反而可能会降低,所以多线程不适合解决运算密集性问题,而是适合解决等待、阻塞的问题,如果使用进程去等待,会浪费大量资源,所以使用更轻量的线程去等待,节约资源。