引言
今天,我们继续学习Linux线程本分,在Linux条件变量中,我们对条件变量的做了详细的说明,今天我们要利用条件变量来引出我们的另一个话题——信号量内容的学习。
1.复习条件变量
在上一期博客中,我们没有对条件变量做具体的使用,所以,这里我们通过一份代码来复习一下,接下来,我们实现基于BlockingQueue的生产者消费者模型。
1.1何为基于BlockingQueue的生产者消费者模型
BlockingQueue在多线程编程中阻塞队列(Blocking Queue)是一种常用于实现生产者和消费者模型的数据结构。其与普通的队列区别在于,当队列为空时,从队列获取元素的操作将会被阻塞,直到队列中被放入了元素;当队列满时,往队列里存放元素的操作也会被阻塞,直到有元素被从队列中取出(以上的操作都是基于不同的线程来说的,线程在对阻塞队列进程操作时会被阻塞)
如图:
1.2分析该模型
这里我想写多个生产线程和多个消费线程的模型
我们来分析一下。
- 首先生产任务的过程和消费任务的过程必须是互斥关系,不可以同时访问该队列(此时,这个队列是共享资源)。
- 当队列满时,生产线程就不能再生产任务,必须在特定的条件变量下等待;同理当队列为空时,消费线程就不能再消费任务,也必须在特定的条件变量下等待。
所以,类应这样设计:
template<class T> class BlockQueue { public: BlockQueue(const int &maxcap=gmaxcap):_maxcap(maxcap) { pthread_mutex_init(&_mutex,nullptr); pthread_cond_init(&_pcond,nullptr); pthread_cond_init(&_ccond,nullptr); } void push(const T&in)//输入型参数,const & { pthread_mutex_lock(&_mutex); while(is_full()) { pthread_cond_wait(&_pcond,&_mutex); } _q.push(in); pthread_cond_signal(&_ccond); pthread_mutex_unlock(&_mutex); } void pop(T*out) { pthread_mutex_lock(&_mutex); while(is_empty()) { pthread_cond_wait(&_ccond,&_mutex); } *out=_q.front(); _q.pop(); pthread_cond_signal(&_pcond); pthread_mutex_unlock(&_mutex); } ~BlockQueue() { pthread_mutex_destroy(&_mutex); pthread_cond_destroy(&_ccond); pthread_cond_destroy(&_pcond); } private: bool is_empty() { return _q.empty(); } bool is_full() { return _q.size()==_maxcap; } private: std::queue<T> _q; int _maxcap; //队列中元素的上线 pthread_mutex_t _mutex; pthread_cond_t _pcond; //生产者对应的条件变量 pthread_cond_t _ccond; };
由于我们不知道存储的数据类型,所以这里我们选择使用泛型编程的方式。
接下来就是要生产任务,为了可以观察到整个生产和消费任务的过程,我们可以生成两个随机数,然后进行运算。代码如下:
class CalTask { using func_t = function<int(int, int, char)>; public: CalTask() {} CalTask(int x, int y, char op, func_t func) :_x(x),_y(y),_op(op),_callback(func) {} string operator()() { int result=_callback(_x,_y,_op); char buffer[1024]; snprintf(buffer,sizeof buffer,"%d %c %d=%d",_x,_op,_y,result); return buffer; } string toTaskstring() { char buffer[1024]; snprintf(buffer,sizeof buffer,"%d %c %d=?",_x,_op,_y); return buffer; } private: int _x; int _y; char _op; func_t _callback; }; const char*oper="+-*/%"; int mymath(int x,int y,char op) { int result=0; switch(op) { case '+': result=x+y; break; case '-': result=x-y; break; case '*': result=x*y; break; case '/': if(y==0) { cerr<<"div zero error"<<endl; result=-1; } else { result=x/y; } break; case '%': if(y==0) { cerr<<"mod zero error"<<endl; result=-1; } else { result=x%y; } default: break; } return result; }
接下来,我们来写整体的代码。
1.3完整代码
我们要创建三个文件:BlockQueue.hpp Task.hpp Main.cc各文件内容如下所示:
BlockQueue.hpp
#pragma once #include<iostream> #include<pthread.h> #include<cstring> #include<unistd.h> #include<cassert> #include<queue> using namespace std; const int gmaxcap=100; template<class T> class BlockQueue { public: BlockQueue(const int &maxcap=gmaxcap):_maxcap(maxcap) { pthread_mutex_init(&_mutex,nullptr); pthread_cond_init(&_pcond,nullptr); pthread_cond_init(&_ccond,nullptr); } void push(const T&in)//输入型参数,const & { pthread_mutex_lock(&_mutex); while(is_full()) { pthread_cond_wait(&_pcond,&_mutex); } _q.push(in); pthread_cond_signal(&_ccond); pthread_mutex_unlock(&_mutex); } void pop(T*out) { pthread_mutex_lock(&_mutex); while(is_empty()) { pthread_cond_wait(&_ccond,&_mutex); } *out=_q.front(); _q.pop(); pthread_cond_signal(&_pcond); pthread_mutex_unlock(&_mutex); } ~BlockQueue() { pthread_mutex_destroy(&_mutex); pthread_cond_destroy(&_ccond); pthread_cond_destroy(&_pcond); } private: bool is_empty() { return _q.empty(); } bool is_full() { return _q.size()==_maxcap; } private: std::queue<T> _q; int _maxcap; //队列中元素的上线 pthread_mutex_t _mutex; pthread_cond_t _pcond; //生产者对应的条件变量 pthread_cond_t _ccond; };
Task.hpp
#pragma once #include <iostream> #include <string> #include <cstdio> #include<string> #include <functional> using namespace std; class CalTask { using func_t = function<int(int, int, char)>; public: CalTask() {} CalTask(int x, int y, char op, func_t func) :_x(x),_y(y),_op(op),_callback(func) {} string operator()() { int result=_callback(_x,_y,_op); char buffer[1024]; snprintf(buffer,sizeof buffer,"%d %c %d=%d",_x,_op,_y,result); return buffer; } string toTaskstring() { char buffer[1024]; snprintf(buffer,sizeof buffer,"%d %c %d=?",_x,_op,_y); return buffer; } private: int _x; int _y; char _op; func_t _callback; }; const char*oper="+-*/%"; int mymath(int x,int y,char op) { int result=0; switch(op) { case '+': result=x+y; break; case '-': result=x-y; break; case '*': result=x*y; break; case '/': if(y==0) { cerr<<"div zero error"<<endl; result=-1; } else result=x/y; } break; case '%': if(y==0) { cerr<<"mod zero error"<<endl; result=-1; } else { result=x%y; } default: break; } return result; }
Main.cc
include "BlockQueue.hpp" #include "Task.hpp" #include<sys/types.h> #include<unistd.h> #include<ctime> #include<iostream> using namespace std; void *productor(void *bqs_) { BlockQueue<CalTask> *bqs=static_cast<BlockQueue<CalTask>*>(bqs_); while(true) { int x=rand()%10+1; int y=rand()%5+1; int opercode=rand()%(sizeof(oper)); CalTask T(x,y,oper[opercode],mymath); bqs->push(T); cout<<"生产任务: "; cout<<T.toTaskstring()<<endl; sleep(1); } } void *consumer(void *bqs_) { BlockQueue<CalTask>*bqs=static_cast<BlockQueue<CalTask>*>(bqs_); while(true) { CalTask T; bqs->pop(&T); cout<<"消费任务: "; cout<<T()<<endl; } } int main() { BlockQueue<CalTask> bqs; pthread_t p[5]; pthread_t c[5]; for(int i=0;i<5;i++) { pthread_create(&p[i],nullptr,productor,&bqs); pthread_create(&c[i],nullptr,consumer,&bqs); } for(int i=0;i<5;i++) { pthread_join(p[i],nullptr); pthread_join(c[i],nullptr); } }
在代码中,有几个点需要注意一下:
第一点:
pthread_cond_wait的第二个参数一定是我们正在使用的互斥锁,这个函数在被运行时,会以原子性的方式将锁释放,然后将自己挂起,等待被条件变量唤醒。该函数在被唤醒时,会自动重新获取持有的锁,然后继续向下执行。
假如数个生产者线程一起被唤醒,然后先后持有锁,接着继续生产任务,当队列剩余的空间小于这些生产者生产的任务时,就会出现问题,所以让所有被唤醒的线程先通过while循环,如果有剩余的空间,再进行任务的生产活动。
生产线程这样处理,消费线程也要这样处理
大家可以在自己试这敲一下,有问题可以在评论区和我交流。
接下来,我们来查找一下这些代码有哪些"不足的地方"
2.代码中的“不足”
一个线程在操作临界资源时,临界资源必须是满足条件的,然后线程才能对临界资源进行操作。比如:在如上代码中,生产者线程只有在队列(临界资源)有剩余空间的条件下,才能进行下一步操作。
可是,临界资源是否满足生产和消费的条件,我们不能事前得知,只等进入临界资源后,再进行进一步的检测。
所以,一般访问临界资源的过程为:先加锁,再检测,如果条件满足,就进行下一步的操作;反之,就将该线程挂起,释放锁,然后挂起等待,等到条件满足时,重新获得锁,接着进行下一步操作。
因为不可能事先得知是否满足条件,所以我们只能先加锁,进入临界资源内部进行检测。
只要我们申请了信号量,就默认对这部分资源的整体使用,但通常情况下,我们使用的仅仅是临界资源的一小部分。
实际情况中,有没有可能不同的线程访问临界资源不同部分的情况,有可能。所以,前辈大佬们给出了一种解决方案——信号量。
3.信号量
3.1什么是信号量
信号量的本质是一把计数器,一把衡量临界资源多少的计数器。只要拥有信号量,就在未来一定能够拥有临界资源的一部分。
申请信号量的本质:就是对临界资源的预定机制。
比如:我想去看电影,首先我要买票。我一旦买到票,无论我去不去看电影,都会有一个位置属于我。买票的过程==申请信号信号量的过程。
所以,在访问临界资源之前,我们可以申请信号量。通过申请信号量,我们就可以获知临界资源的使用情况。①只要申请成功,就一定有我可以访问的资源。②只要申请失败,说明条件不就绪,只能等待。如此,就不需要进入临界资源再进行检测了。
3.2信号量的相关接口
如上这些借口如果调用成功的话,返回0;调用失败的话,返回-1,并且错误原因被设置。
我们知道信号量的本质是一把计数器,所以信号量必须可以进行递增和递减的操作。
- 信号量-1:申请资源,其过程必须是原子性的。简称P操作。
- 信号量+1:归还资源,其过程必须是原子性的。简称V操作。
所以,信号量的核心操作:PV原语。
接下来,我们就使用信号量来完成我们的基于环形队列的生产消费模型。
3.3用信号量来实现基于环形队列的生产消费模型
3.3.1对环形队列的简单介绍
相信大家在C++学习期间到都模拟实现过环形队列队列。如图:
环形队列的逻辑结构为环形,但其存储结构实际上就是队列,其实就是一个数组,只不过用下标不断的%上队列的长度。
大家在模拟实现环形队列时,大家必定遇到的问题是:当rear==front时,究竟是环形队列已满还是环形队列为空呢?其实,这个问题有多种处理方式,今天就不讲了。
今天,我们的基于环形队列的生产消费模型必须遵守哪些规则呢?
我们来讲一个故事:
张三和李四在一个房间里做游戏,这个房间里有一张大圆桌,桌子上有很多的盘子。规定张三往每个盘子里放一个桃子🍑,然后李四在后边吃桃子🍑,由于李四还要吃桃子,所以速度一定比张三放的速度满。
总结一下,我们发现张三和李四必须满足这些规律:
- 李四不可以超过张三——消费者不可以超过生产者。
- 张三不可以把李四套一个圈——生产者不可以把消费者套一个圈。
- 张三和李四什么时候在一起?①盘子全为空,张三和李四在一起,张三先运行(生产者先运行)。②盘子全为满,张三和李四在一起,李四先运行(消费者先运行)。③其他情况,张三和李四指向不同的位置。
我们将这些规则迁移到环形队列的生产消费模型,就是生产消费模型应该遵守的规则:
①消费者不能超过生产者。②生产者不能把消费者套一个圈。③生产者和消费者什么情况下会在一起呢?空的时候和满的时候,对应不同的处理方式。④只要生产者和消费者指向不同的位置,就可以实现生产者和消费者的并发执行。只有在为空和为 满时,才会出现同步和互斥问题。
那这些规则由什么来保证呢?信号量。信号量是表征临界资源中资源数目的。
1.对于生产者而言,看中的是队列中的剩余空间——空间资源定义一个信号量。
2.对于消费者而言,看中的是队列中的数据——数据资源定义一个信号量。
接下来,我们基于这份伪代码来理解一下,看看能否满足我们的规则。
生产者关注的是队列里的剩余空间,在队列为空时剩余空间为10,所以生产者可以顺利申请到信号量。但是由于空间中这部分资源已经被占用,所以无法归还。但是消费者所关注的队列中的数据资源不知不觉中已经多了一份。所以对消费者信号量应进行V操作。
消费者关注的是队列中的数据资源,队列刚开始为空时,数据资源为0,消费者申请失败。等到生产者申请神域空间成功后,生产了数据。所以消费者可以成功申请到数据资源信号量,然后消费数据。但不知不觉,队列中的剩余空间多了一份,所以应对剩余空间资源的信号量进行V操作。
若队列满时,剩余空间信号量为0,生产者申请信号量失败。此时,数据资源信号量为满,消费者可以申请到信号量,从而进行操作。所以必须消费者先运行。
若队列空时,数据资源信号量为0,消费者申请信号量失败。此时,剩余空间信号量为满,生产者可以申请到信号量,从而进行操作。所以必须生产者先运行。
所以,这伪代码完全符合我们的规则。接下来,我们编写单生产进程和单消费进程的代码。
编写代码
我们创建三个源文件:RingQueue.hpp main.cc Task.hpp
Ringqueue.hpp:
#pragma once #include <iostream> #include <vector> #include <cassert> #include <semaphore.h> #include <pthread.h> static const int gcap = 5; template<class T> class RingQueue { private: void P(sem_t &sem) { int n = sem_wait(&sem); assert(n == 0); // if (void)n; } void V(sem_t &sem) { int n = sem_post(&sem); assert(n == 0); (void)n; } public: RingQueue(const int &cap = gcap): _queue(cap), _cap(cap) { int n = sem_init(&_spaceSem, 0, _cap); assert(n == 0); n = sem_init(&_dataSem, 0, 0); assert(n == 0); _productorStep = _consumerStep = 0; pthread_mutex_init(&_pmutex, nullptr); pthread_mutex_init(&_cmutex, nullptr); } // 生产者 void Push(const T &in) { // ?: 这个代码 有没有优化的可能 // 你认为:现加锁,后申请信号量,还是现申请信号量,在加锁? P(_spaceSem); // 申请到了空间信号量,意味着,我一定能进行正常的生产 pthread_mutex_lock(&_pmutex); _queue[_productorStep++] = in; _productorStep %= _cap; pthread_mutex_unlock(&_pmutex); V(_dataSem); } // 消费者 void Pop(T *out) { // 你认为:现加锁,后申请信号量,还是现申请信号量,在加锁? P(_dataSem); pthread_mutex_lock(&_cmutex); *out = _queue[_consumerStep++]; _consumerStep %= _cap; pthread_mutex_unlock(&_cmutex); V(_spaceSem); } ~RingQueue() { sem_destroy(&_spaceSem); sem_destroy(&_dataSem); pthread_mutex_destroy(&_pmutex); pthread_mutex_destroy(&_cmutex); } private: std::vector<T> _queue; int _cap; sem_t _spaceSem; // 生产者 想生产,看中的是什么资源呢? 空间资源 sem_t _dataSem; // 消费者 想消费,看中的是什么资源呢? 数据资源 int _productorStep; int _consumerStep; pthread_mutex_t _pmutex; pthread_mutex_t _cmutex; };
Task.hpp
#pragma once #include <iostream> #include <string> #include <cstdio> #include <functional> class Task { using func_t = std::function<int(int,int,char)>; // typedef std::function<int(int,int)> func_t; public: Task() {} Task(int x, int y, char op, func_t func) :_x(x), _y(y), _op(op), _callback(func) {} std::string operator()() { int result = _callback(_x, _y, _op); char buffer[1024]; snprintf(buffer, sizeof buffer, "%d %c %d = %d", _x, _op, _y, result); return buffer; } std::string toTaskString() { char buffer[1024]; snprintf(buffer, sizeof buffer, "%d %c %d = ?", _x, _op, _y); return buffer; } private: int _x; int _y; char _op; func_t _callback; }; const std::string oper = "+-*/%"; int mymath(int x, int y, char op) { int result = 0; switch (op) { case '+': result = x + y; break; case '-': result = x - y; break; case '*': result = x * y; break; case '/': { if (y == 0) { std::cerr << "div zero error!" << std::endl; result = -1; } else result = x / y; } break; case '%': { if (y == 0) { std::cerr << "mod zero error!" << std::endl; result = -1; } else result = x % y; } break; default: // do nothing break; } return result; }
main.cc
#include "RingQueue.hpp" #include "Task.hpp" #include <pthread.h> #include <ctime> #include <cstdlib> #include <sys/types.h> #include <unistd.h> std::string SelfName() { char name[128]; snprintf(name, sizeof(name), "thread[0x%x]", pthread_self()); return name; } void *ProductorRoutine(void *rq) { // RingQueue<int> *ringqueue = static_cast<RingQueue<int> *>(rq); RingQueue<Task> *ringqueue = static_cast<RingQueue<Task> *>(rq); while(true) { // version1 // int data = rand() % 10 + 1; // ringqueue->Push(data); // std::cout << "生产完成,生产的数据是:" << data << std::endl; // version2 // 构建or获取任务 --- 这个是要花时间的! int x = rand() % 10; int y = rand() % 5; char op = oper[rand()%oper.size()]; Task t(x, y, op, mymath); // 生产任务 ringqueue->Push(t); // 输出提示 std::cout << SelfName() << ", 生产者派发了一个任务: " << t.toTaskString() << std::endl; // sleep(1); } } void *ConsumerRoutine(void *rq) { // RingQueue<int> *ringqueue = static_cast<RingQueue<int> *>(rq); RingQueue<Task> *ringqueue = static_cast<RingQueue<Task> *>(rq); while(true) { //version1 // int data; // ringqueue->Pop(&data); // std::cout << "消费完成,消费的数据是:" << data << std::endl; // sleep(1); // version2 Task t; //消费任务 ringqueue->Pop(&t); std::string result = t(); // 消费也是要花时间的! std::cout << SelfName() << ", 消费者消费了一个任务: " << result << std::endl; // sleep(1); } } int main() { srand((unsigned int)time(nullptr) ^ getpid() ^ pthread_self() ^ 0x71727374); // RingQueue<int> *rq = new RingQueue<int>(); RingQueue<Task> *rq = new RingQueue<Task>(); // 单生产,单消费,多生产,多消费 --> 只要保证,最终进入临界区的是一个生产,一个消费就行! // 多生产,多消费的意义?? pthread_t p[4], c[8]; for(int i = 0; i < 4; i++) pthread_create(p+i, nullptr, ProductorRoutine, rq); for(int i = 0; i < 8; i++) pthread_create(c+i, nullptr, ConsumerRoutine, rq); for(int i = 0; i < 4; i++) pthread_join(p[i], nullptr); for(int i = 0; i < 8; i++) pthread_join(c[i], nullptr); delete rq; return 0; }
大家可以自己敲一敲,试一下。
写到这里,这篇博客就结束了,下篇博客我们再见。