Linux线程管理

avatar
作者
猴君
阅读量:0

一、线程介绍

什么是线程:

线程是操作系统能内够进行运算、执行的最小单位,它被包含在进程之中,是进程中的实际运作单位。一条线程指的是进程中一个单一顺序的控制流,一个进程中可以并发多个线程,每条线程并行执行不同的任务。

总结:线程是进程的一部分,是进程内负责执行的单位,进程是由资源单位(内存资源、信号处理方案、文件表)+执行单位组成,默认情况下进程内只有一个线程,但可以有多个。

线程的发展简史:

60年代,在操作系统中能拥有资源和独立运行的基本单位是进程。

随着计算机技术的发展,进程出现了很多弊端:

一是由于进程是资源拥有者,创建、撤消与切换存在较大的时间开销,因此需要引入轻型进程;

二是由于对称多处理机出现,可以满足多个运行单位,而多个进程并行开销过大。

因此在80年代,出现了能独立运行的基本单位——线程(Threads)。

线程的调度策略:

线程是独立调度和分派的基本单位,有三种不同的调试策略:

1、线程可以为操作系统内核调度的内核线程,如Win32线程;

2、由用户进行自行调度的用户线程,如Linux、UNIX平台的POSIX Thread;

3、由内核与用户进程进行混合调度,如Windows 7的线程。

多线程适用的范围:

一个进程可以有很多线程,每条线程并行执行不同的任务。 ​ 在多核或多CPU,或支持Hyper-threading的CPU上使用多线程程序设计的好处是显而易见,即提高了程序的执行吞吐率。

在单CPU单核的计算机上,使用多线程技术,可以把进程中负责I/O处理、人机交互而常被阻塞的部分与密集计算的部分分开来执行,原因就是线程占用的资源少,被阻塞时不浪费资源。

线程的特点:
轻型实体:

线程中的实体基本上不拥有系统资源,只是有一点必不可少的、能保证独立运行的资源。线程的实体包括用于指示被执行指令序列的程序计数器、局部变量、状态参数和返回地址。

线程是动态概念,它的动态特性由线程控制块TCB(Thread Control Block)描述,包括以下信息:

1、线程状态

2、当线程不运行时,被保存的现场资源。

3、一组执行堆栈

4、存放每个线程的局部变量主存区

5、访问同一个进程中的主存和其它资源

独立调度和分派的基本单位:

在多线程OS中,线程是能独立运行的基本单位,因而也是独立调度和分派的基本单位。由于线程很“轻”,故线程的切换非常迅速且开销小(在同一进程中的)。

可并发执行:

在一个进程中的多个线程之间,可以并发执行,甚至允许在一个进程中所有线程都能并发执行;同样,不同进程中的线程也能并发执行,充分利用和发挥了CPU与外围设备并行工作的能力。

共享进程资源:

在同一进程中的各个线程,都可以访问该进程的用户空间,此外,还可以访问进程所拥有的已打开文件、定时器、信号量等,线程可以共享该进程所拥有的资源。所以线程之间互相通信不必调用内核。

二、线程与进程的区别(多进程与多线程)

资源:

进程采用虚拟空间+用户态/内核态机制,所以就导致进程与进程之间是互相独立的,各自的资源不可见。

在同一进程中的各个线程都可以共享该进程所拥有的资源。

多进程之间资源是独立的,多线程之间资源是共享的。

通信:

由于进程之间是互相独立的,需要使用各种IPC通信机制,保障多个进程协同工作。

同一进程中的各个线程共享该进程所拥有的资源,线程间可以直接读写进程数据段来进行通信,但需要线程同步和互斥手段的辅助,以保证数据的一致性。

多进程之间资源是独立的,所以需要通信,多线程之间资源是共享的,所以需要同步和互斥。

调度:

无论系统采用什么样的线程调试策略,线程上下文切换都比进程上下文切换要快得多。

身份:

进程是个资源单位,线程是个执行单位,并且线程是进程的一部分,线程需要进程安身立命,进程也需要线程当牛做马。

三、POSIX线程库

POSIX线程库介绍:

POSIX线程(POSIX Threads,常被缩写为pthread)是POSIX的线程标准,定义了创建和操纵线程的一套API。 ​ 实现POSIX 线程标准的库常被称作pthread,一般用于Unix-likePOSIX 系统,如Linux、Solaris。但是Microsoft Windows上的实现也存在,例如直接使用Windows API实现的第三方库pthread-w32。

API具体内容:

pthread定义了一套C语言的类型、函数与常量,它以pthread.h头文件和一个接口库libpthread.so,gcc和g++编译器没有默认链接该库,需要程序员使用 -l pthread 参数进行手动链接。

pthread API中大致共有100个函数调用,全都以"pthread_"开头,并可以分为四类:

1、线程管理,如创建线程,等待线程,查询线程状态等。

2、互斥锁,有创建、摧毁、锁定、解锁、设置属性等操作

3、条件变量,有创建、摧毁、等待、通知、设置与查询属性等操作

4、使用了互斥锁的线程间的同步管理。

四、创建线程

int pthread_create (pthread_t* thread,                     const pthread_attr_t* attr,                     void* (*start_routine) (void*),                     void* arg); ​ thread        - 线程ID,输出型参数。我们目前使用的Linux中pthread_t即unsigned long int attr          - 线程属性,NULL表示缺省属性,如果没有特殊需求,一般写NULL即可 start_routine - 线程入口函数指针,参数和返回值的类型都是void*                 启动线程本质上就是调用一个函数,只不过是在一个独立的线程中调用的,函数返回即线程结束 arg           - 传递给线程过程函数的参数 返回值:成功返回0,失败返回错误码,但不会修改全局的错误变量,也就是无法使用perror获取错误原因。       注意:     1、restrict: C99引入的编译优化指示符,提高重复解引用同一个指针的效率。     2、应设法保证在线程过程函数执行期间,其参数所指向的目标持久有效。
#include <stdio.h> #include <unistd.h> #include <pthread.h> ​ void* run(void* arg) {     for(;;)     {         printf("#");         fflush(stdout);         sleep(1);     } } ​ int main(int argc,const char* argv[]) {     pthread_t tid;     int ret = pthread_create(&tid,NULL,run,NULL);     printf("%d %lu\n",ret,tid); ​     for(;;)     {         printf("*");         fflush(stdout);         sleep(1);     }              return 0; }

五、线程回收

int pthread_join (pthread_t thread, void** retval); 功能:等待thread参数所标识的线程结束,并回收相关资源,如果thread线程没有结束则阻塞 retval:获得线程正常结束时的返回值,是输出型的参数,用于获取线程入口函数的返回值。 返回值:成功返回0,失败返回错误码      从线程过程函数中返回值的方法:     1、线程过程函数将所需返回的内容放在一块内存中,返回该内存块的首地址,保证这块内存在函数返回,即线程结束,以后依然有效;     2、若retval参数非NULL,则pthread_join函数将线程入口函数所返回的指针,拷贝到该参数所指向的内存中;     3、线程入口函数所返回的指针指向text、data、bss内存段的数据,如果指向heap内存段,则还需保证在用过该内存之后释放之。

六、获取线程ID、判断线程ID

pthread_t pthread_self (void); 成功返回调用线程的ID,不会失败。 ​ int pthread_equal (pthread_t t1, pthread_t t2); 功能:若参数t1和t2所标识的线程ID相等,则返回非零,否则返回0。 ​ 注意:某些实现的pthread_t不是unsigned long int类型,可能是结构体类型,无法通过“==”判断其相等性。

七、终止线程

方法1:从线程入口函数中return,主线程除外。

方法2:调用pthread_exit函数。

void pthread_exit (void* retval); retval - 和线程过程函数的返回值语义相同。

注意:在任何线程中调用exit函数都将终止整个进程。

问题:主线程结束,子线程是否会跟着一起结束?

主线程结束,并不会导致子线程跟着一起结束,它们之间没有必然联系。

但是,主线程如果执行到最后一行,会执行return 0或隐藏的return 0,而在main函数中执行return 0就相当于执行exit(0),然后当前进程就会结束,有两种方法可以避免这种情况:

方法1:

等待所有子线程结束,主线程再执行return 0;

子线程在一定时间内会结束,侧使用pthread_join。

方法2:

立即结束主线程,不要让它执行return 0;

当子线程的结束时间不确定,则使用pthread_exit。

注意:这种情况会产生新的问题,子线程的资源没有办法回收。

#include <stdio.h> #include <pthread.h> #include <unistd.h> ​ void* run(void* arg) {     for(int i=0; ;i++)     {         printf("子线程:%lu %d\n",pthread_self(),i);         sleep(1);     } } ​ int main(void) {     pthread_t tid;     pthread_create(&tid,NULL,run,NULL); ​     for(int i=0; i<3; i++)     {         printf("我是主线程,我要结束了,倒计时:%d\n",3-i);         sleep(1);     }          exit }

八、线程分离

同步方式(非分离状态):创建线程之后主线程调用pthread_join函数等待其终止,并释放线程资源。

异步方式(分离状态):无需创建者等待,线程终止后自行释放资源。

int pthread_detach (pthread_t thread); 功能:使thread参数所标识的线程进入分离(DETACHED)状态。 返回值:成功返回0,失败返回错误码。

注意:如果若干个子线程需要长时间执行,不知道什么时候能结束,为了避免它父线程陷入无尽的等待,可提前给子线程设置分离状态。

九、取消线程

向发送取消请求:
int pthread_cancel (pthread_t thread); 功能:该函数只是向线程发出取消请求,并不等待线程终止。 ​ 缺省情况下,线程在收到取消请求以后,并不会立即终止,而是仍继续运行,直到其达到某个取消点。 在取消点处,线程检查其自身是否已被取消了,并做出相应动作。
设置可取消状态:
int pthread_setcancelstate (int state,int* oldstate); 成功返回0,并通过oldstate参数输出原可取消状态(若非NULL),失败返回错误码。 ​ state取值:    PTHREAD_CANCEL_ENABLE  - 接受取消请求(缺省)。    PTHREAD_CANCEL_DISABLE - 忽略取消请求。
设置可取消类型:
int pthread_setcanceltype (int type, int* oldtype); ​ 成功返回0,并通过oldtype参数输出原可取消类型 (若非NULL),失败返回错误码。 ​ type取值:    PTHREAD_CANCEL_DEFERRED     - 延迟取消(缺省)。       被取消线程在接收到取消请求之后并不立即响应,        而是一直等到执行了特定的函数(取消点)之后再响应该请求。    PTHREAD_CANCEL_ASYNCHRONOUS - 异步取消。       被取消线程可以在任意时间取消,不是非得遇到取消点才能被取消。       但是操作系统并不能保证这一点。

十、线程属性

int pthread_create (pthread_t* restrict thread,                     const pthread_attr_t* restrict attr,                     void* (*start_routine) (void*),                     void* restrict arg); ​ //创建线程函数的第二个参数即为线程属性,传空指针表示使用缺省属性。 typedef struct {     // 分离状态     int detachstate;        // PTHREAD_CREATE_DETACHED - 分离线程。        // PTHREAD_CREATE_JOINABLE(缺省) - 可汇合线程。 ​     // 竞争范围     int scope;        // PTHREAD_SCOPE_SYSTEM - 在系统范围内竞争资源(时间片)。        // PTHREAD_SCOPE_PROCESS(Linux不支持) - 在进程范围内竞争资源。      ​     // 继承特性     int inheritsched;        // PTHREAD_INHERIT_SCHED(缺省) - 调度属性自创建者线程继承。        // PTHREAD_EXPLICIT_SCHED - 调度属性由后面两个成员确定。      ​     // 调度策略     nt schedpolicy;         // SCHED_FIFO - 先进先出策略。             // 没有时间片。             // 一个FIFO线程会持续运行,直到阻塞或有高优先级线程就绪。             // 当FIFO线程阻塞时,系统将其移出就绪队列,待其恢复时再加到同优先级就绪队列的末尾。             // 当FIFO线程被高优先级线程抢占时,它在就绪队列中的位置不变。             // 因此一旦高优先级线程终止或阻塞,被抢占的FIFO线程将会立即继续运行。         // SCHED_RR - 轮转策略。             // 给每个RR线程分配一个时间片,一但RR线程的时间片耗尽,系统即将移到就绪队列的末尾。         // SCHED_OTHER(缺省) - 普通策略。             // 静态优先级为0。任何就绪的FIFO线程或RR线程,都会抢占此类线程。     ​     // 调度参数     struct sched_param schedparam;         // struct sched_param {         //     int sched_priority; /* 静态优先级 */         // };      ​     // 栈尾警戒区大小(字节)  缺省一页(4096字节)。     size_t guardsize; ​     // 栈地址     void* stackaddr; ​     // 栈大小(字节)     size_t stacksize; } pthread_attr_t; ​ 注意:不要手动读写该结构体,而应调用pthread_attr_set/get函数设置/获取具体属性项。
设置线程属性:
初始化线程属性结构体:
pthread_attr_t attr = {}; // 不要使用这种方式 int pthread_attr_init (pthread_attr_t* attr);
设置具体线程属性项:
int pthread_attr_setdetachstate (pthread_attr_t* attr,int detachstate); int pthread_attr_setscope (pthread_attr_t* attr,int scope); int pthread_attr_setinheritsched (pthread_attr_t* attr,int inheritsched); int pthread_attr_setschedpolicy (pthread_attr_t* attr,int policy); int pthread_attr_setschedparam (pthread_attr_t* attr,const struct sched_param* param); int pthread_attr_setguardsize (pthread_attr_t* attr,size_t guardsize); int pthread_attr_setstackaddr (pthread_attr_t* attr,void* stackaddr); int pthread_attr_setstacksize (pthread_attr_t* attr,size_t stacksize); int pthread_attr_setstack (pthread_attr_t* attr,void* stackaddr, size_t stacksize);
以设置好的线程属性结构体为参数创建线程:
int pthread_create (pthread_t* restrict thread,                     const pthread_attr_t* testrict attr,                     void* (*start_routine) (void*),                     void* restrict arg);
销毁线程属性结构体:
int pthread_attr_destroy (pthread_attr_t* attr);
获取线程属性:
获取线程属性结构体:
int pthread_getattr_np (pthread_t thread,pthread_attr_t* attr);
获取具体线程属性项:
int pthread_attr_getdetachstate (pthread_attr_t* attr,int* detachstate); int pthread_attr_getscope (pthread_attr_t* attr,int* scope); int pthread_attr_getinheritsched (pthread_attr_t* attr,int* inheritsched); int pthread_attr_getschedpolicy (pthread_attr_t* attr,int* policy); int pthread_attr_getschedparam (pthread_attr_t* attr,struct sched_param* param); int pthread_attr_getguardsize (pthread_attr_t* attr,size_t* guardsize); int pthread_attr_getstackaddr (pthread_attr_t* attr,void** stackaddr); int pthread_attr_getstacksize (pthread_attr_t* attr,size_t* stacksize); int pthread_attr_getstack (pthread_attr_t* attr,void** stackaddr, size_t* stacksize); 以上所有函数成功返回0,失败返回错误码。
#include <stdio.h> #include <stdlib.h> #include <string.h> #include <unistd.h> #define __USE_GNU #include <pthread.h> ​ int printattrs (pthread_attr_t* attr)  {     printf("------- 线程属性 -------\n"); ​     int detachstate;     int error = pthread_attr_getdetachstate (attr, &detachstate);     if (error)      {         fprintf (stderr, "pthread_attr_getdetachstate: %s\n",strerror (error));         return -1;     }     printf("分离状态:  %s\n",         (detachstate == PTHREAD_CREATE_DETACHED) ? "分离线程" :         (detachstate == PTHREAD_CREATE_JOINABLE) ? "可汇合线程" :         "未知"); ​     int scope;     if ((error = pthread_attr_getscope (attr, &scope)) != 0)      {         fprintf (stderr, "pthread_attr_getscope: %s\n",             strerror (error));         return -1;     }     printf ("竞争范围:  %s\n",         (scope == PTHREAD_SCOPE_SYSTEM)  ? "系统级竞争" :         (scope == PTHREAD_SCOPE_PROCESS) ? "进程级竞争" : "未知"); ​     int inheritsched;     if ((error = pthread_attr_getinheritsched (attr,         &inheritsched)) != 0)      {         fprintf (stderr, "pthread_attr_getinheritsched: %s\n",             strerror (error));         return -1;     }     printf ("继承特性:  %s\n",         (inheritsched == PTHREAD_INHERIT_SCHED)  ? "继承调用属性" :         (inheritsched == PTHREAD_EXPLICIT_SCHED) ? "显式调用属性" :         "未知"); ​     int schedpolicy;     if ((error = pthread_attr_getschedpolicy(attr,&schedpolicy)) != 0)      {         fprintf (stderr, "pthread_attr_getschedpolicy: %s\n",strerror (error));         return -1;     }     printf ("调度策略:  %s\n",         (schedpolicy == SCHED_OTHER) ? "普通" :         (schedpolicy == SCHED_FIFO)  ? "先进先出" :         (schedpolicy == SCHED_RR)    ? "轮转" : "未知"); ​     struct sched_param schedparam;     if ((error = pthread_attr_getschedparam (attr, &schedparam)) != 0)      {         fprintf (stderr, "pthread_attr_getschedparam: %s\n",strerror (error));         return -1;     }     printf ("调度优先级:%d\n", schedparam.sched_priority); ​     size_t guardsize;     if ((error = pthread_attr_getguardsize(attr, &guardsize)) != 0)      {         fprintf (stderr, "pthread_attr_getguardsize: %s\n",strerror (error));         return -1;     }     printf ("栈尾警戒区:%u字节\n", guardsize);     /*     void* stackaddr;     if ((error = pthread_attr_getstackaddr (attr, &stackaddr)) != 0)      {         fprintf (stderr, "pthread_attr_getstackaddr: %s\n",strerror (error));         return -1;     }     printf ("栈地址:    %p\n", stackaddr); ​     size_t stacksize;     if ((error = pthread_attr_getstacksize (attr, &stacksize)) != 0)      {         fprintf (stderr, "pthread_attr_getstacksize: %s\n",strerror (error));         return -1;     }     printf ("栈大小:    %u字节\n", stacksize);     */     void* stackaddr;     size_t stacksize;     if ((error = pthread_attr_getstack (attr, &stackaddr,&stacksize)) != 0)      {         fprintf (stderr, "pthread_attr_getstack: %s\n",strerror (error));         return -1;     }     printf ("栈地址:    %p\n", stackaddr);     printf ("栈大小:    %u字节\n", stacksize); ​     printf("------------------------\n"); ​     return 0; } ​ void* thread_proc (void* arg)  {     pthread_attr_t attr;     int error = pthread_getattr_np (pthread_self (), &attr);     if (error)      {         fprintf (stderr, "pthread_getattr_np: %s\n", strerror (error));         exit (EXIT_FAILURE);     } ​     if (printattrs (&attr) < 0)         exit (EXIT_FAILURE); ​     exit (EXIT_SUCCESS); ​     return NULL; } ​ int main (int argc, char* argv[])  {     int error;     pthread_attr_t attr, *pattr = NULL; ​     if (argc > 1)      {         if (strcmp (argv[1], "-s"))          {             fprintf (stderr, "用法:%s [-s]\n", argv[0]);             return -1;         } ​         if ((error = pthread_attr_init (&attr)) != 0)          {             fprintf (stderr, "pthread_attr_init: %s\n",strerror (error));             return -1;         } ​         if ((error = pthread_attr_setdetachstate (&attr,PTHREAD_CREATE_DETACHED)) != 0)          {             fprintf (stderr, "pthread_attr_setdetachstate: %s\n",strerror (error));             return -1;         } ​         if ((error = pthread_attr_setinheritsched (&attr,PTHREAD_EXPLICIT_SCHED)) != 0)          {             fprintf (stderr, "pthread_attr_setinheritsched: %s\n",strerror (error));             return -1;         } ​         if ((error = pthread_attr_setstacksize (&attr, 4096*10)) != 0)          {             fprintf (stderr, "pthread_attr_setstack: %s\n",strerror (error));             return -1;         } ​         pattr = &attr;     } ​     pthread_t tid;     if ((error = pthread_create (&tid, pattr, thread_proc,NULL)) != 0)      {         fprintf (stderr, "pthread_create: %s\n", strerror (error));         return -1;     } ​     if (pattr)     {         if ((error = pthread_attr_destroy (pattr)) != 0)          {             fprintf (stderr, "pthread_attr_destroy: %s\n",strerror (error));             return -1;         }     } ​     pause ();     return 0; }

注意:如果man手册查不到线程的相关函数,安装完整版gnu手册:sudo apt-get install glibc-doc。

练习:实现大文件的多线程cp拷贝,对比系统cp命令,哪个速度更快,为什么?

#include <stdio.h> #include <stdlib.h> #include <unistd.h> #include <pthread.h> #include <sys/stat.h> #include <sys/types.h> ​ typedef struct Task {     char* src;     char* dest;     size_t start;     size_t end; }Task; ​ void* run(void* arg) {     Task* task = arg; ​     // 打开源文件和目标文件     FILE* src_fp = fopen(task->src,"r");     FILE* dest_fp = fopen(task->dest,"a");     if(NULL == src_fp || NULL == dest_fp)     {         perror("fopen");         return NULL;     } ​     // 调整文件的位置指针     fseek(src_fp,task->start,SEEK_SET);     fseek(dest_fp,task->start,SEEK_SET); ​     // 创建缓冲区     char buf[1024];     size_t buf_size = sizeof(buf); ​     for(int i=task->start; i<task->end; i+=buf_size)     {         int ret = fread(buf,1,buf_size,src_fp);         if(0 >= ret)             break;         fwrite(buf,1,ret,dest_fp);     } ​     fclose(src_fp);     fclose(dest_fp);     free(task); } ​ int main(int argc,const char* argv[]) {     if(3 != argc)     {         puts("Use:./cp <src> <dest>");         return 0;     } ​     // 获取到文件的大小     struct stat buf;     if(stat(argv[1],&buf))     {         perror("stat");         return -1;     } ​     // 创建出目标文件     if(NULL == fopen(argv[2],"w"))     {         perror("fopen");         return -2;     } ​     // 计算需要的线程数量,以100M为单位     size_t pthread_cnt = buf.st_size/(1024*1024*100)+1; ​     // 分配任务     pthread_t tid;     for(int i=0; i<pthread_cnt; i++)     {         Task* task = malloc(sizeof(Task));         task->src = (char*)argv[1];         task->dest = (char*)argv[2];         task->start = i*1024*1024*100;         task->end = (i+1)*1024*1024*100; ​         // 创建子线程并分配任务         pthread_create(&tid,NULL,run,task); ​         // 分享子线程         pthread_detach(tid);     }          // 结束主线程     pthread_exit(NULL); }

多线程并不能提高运行速度,反而可能会降低,所以多线程不适合解决运算密集性问题,而是适合解决等待、阻塞的问题,如果使用进程去等待,会浪费大量资源,所以使用更轻量的线程去等待,节约资源。

    广告一刻

    为您即时展示最新活动产品广告消息,让您随时掌握产品活动新动态!