深入了解linux下TCP并发服务器和IO模型的实现

avatar
作者
猴君
阅读量:0

一、整体框架

在网络编程中,服务器的架构可以根据需求不同而有所不同。主要有以下几种框架:

1. 单循环服务器:同一时刻只处理一个客户端的请求,通常使用传统的阻塞式编程模型。这种模型简单易实现,但处理能力有限,无法有效应对多个客户端的并发请求。

2. 并发服务器:能够处理多个客户端的请求。通过引入多线程或多进程等技术来实现并发处理,从而提高服务器的处理能力和响应速度。并发服务器可以分为以下几种实现方式:
   - 多进程:每个客户端连接由一个独立的进程处理。常用于需要隔离处理环境的场景。
   - 多线程:每个客户端连接由一个独立的线程处理。适用于需要较高资源共享的场景。
   - IO多路复用:使用单个进程/线程处理多个连接,通过高效的IO多路复用机制来管理多个并发连接。适用于需要高并发处理的场景。

 二、服务器

2.1 单循环服务器 vs 并发服务器

- 单循环服务器:
  - 处理一个客户端的请求时,其他客户端的请求必须等待,导致处理效率低。
  - 简单易实现,但不适合高并发场景。

- 并发服务器:
  - 可以同时处理多个客户端的请求。通过创建多个进程或线程来处理不同的客户端连接,从而提高服务器的并发处理能力。
  - UDP协议由于是无连接的,天然支持并发处理。每个数据报独立处理,不需要建立持久连接。
  - TCP协议是面向连接的,传统上一个TCP服务器只能处理一个客户端连接。但通过多进程或多线程的方式,可以实现TCP并发服务器。

三、TCP并发服务器

3.1 多进程

多进程模型的服务器在接收到连接请求时,会创建一个新的进程来处理每一个客户端连接。以下是基本的执行流程:

1. socket():创建一个新的套接字。
2. bind():将套接字绑定到特定的IP地址和端口号。
3. listen():将套接字设置为监听模式,等待客户端的连接请求。
4. accept():接受客户端的连接请求,返回一个新的套接字用于与客户端通信。
5. fork():创建一个子进程来处理新的客户端连接。父进程继续监听新的连接请求。

3.2 多线程

多线程模型的服务器在接收到连接请求时,会创建一个新的线程来处理每一个客户端连接。以下是一个示例代码:


/*************************************************************************
    > File Name: pthread.c
    > Author: yas
    > Mail: rage_yas@hotmail.com
    > Created Time: Tue 27 Aug 2024 02:48:41 PM
 ************************************************************************/

#include <stdio.h>
#include <stdlib.h>
#include <pthread.h>
#include <sys/types.h>
#include <sys/socket.h>
#include <unistd.h>
#include <string.h>
#include <arpa/inet.h>

void *doSth(void *arg) {
    int connfd = *((int *)arg); 
    while (1) {
        char buff[1024] = {0};
        ssize_t size = recv(connfd, buff, sizeof(buff), 0);
        if (size <= 0) {
            break;
        }
        printf("cli--------->%s\n", buff);
        strcat(buff, "----->ok!");
        send(connfd, buff, strlen(buff), 0);
    }
    close(connfd);
    return NULL;
}

int conct(const char *ip, unsigned short port) {
    int sockfd = socket(AF_INET, SOCK_STREAM, 0);
    if (sockfd == -1) {
        return -1;
    }
    struct sockaddr_in ser;
    ser.sin_family = AF_INET;
    ser.sin_port = htons(port);
    ser.sin_addr.s_addr = inet_addr(ip);
    int ret = bind(sockfd, (struct sockaddr *)&ser, sizeof(ser));
    if (ret == -1) {
        perror("fail bind");
        return -1;
    }
    ret = listen(sockfd, 120);
    if (ret == -1) {
        return -1;
    }
    return sockfd;
}

int main(int argc, char *argv[]) {
    int connfd = 0;
    pthread_t tid;
    int sockfd = conct("192.168.1.112", 60000);
    if (sockfd == -1) {
        return -1;
    }
    while (1) {
        connfd = accept(sockfd, NULL, NULL);
        if (connfd == -1) {
            return -1;
        }
        pthread_create(&tid, NULL, doSth, &connfd);
        pthread_detach(tid);
    }
    return 0;
}
 

在这个示例中:
- `pthread_create` 用于创建新的线程来处理客户端请求。
- `pthread_detach` 用于分离线程,使其在完成后自动回收资源。

3.3 IO多路复用

IO多路复用技术允许单个进程/线程处理多个IO操作,常用于高并发场景。主要实现方式有:
- select:检查多个文件描述符的状态,判断是否可以进行读写操作。
- poll:与`select`类似,但支持更多的文件描述符。
- epoll:高效的IO多路复用机制,适用于大规模文件描述符的场景。

四、IO模型

4.1 阻塞IO

在阻塞IO模型中,系统调用会阻塞直到有数据可用或操作完成。例如,`fgets`、`scanf`、`read`、`recv`等。

特点:
- CPU占有率低:由于阻塞等待,CPU不会频繁进行上下文切换。
- 执行效率低:处理效率低下,特别是在处理大量连接时。

4.2 非阻塞IO

非阻塞IO模型允许系统调用立即返回,无论是否有数据可用。需要通过轮询来检查数据的到达。

特点:
- CPU占有率高:由于轮询机制,CPU会不断检查IO状态,导致较高的占用率。
- 实现复杂:需要处理数据是否可用的逻辑。

实现步骤:
1. 获取文件描述符的属性。
2. 增加非阻塞属性。
3. 设置新属性。

示例代码:


#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <fcntl.h>
#include <string.h>
#include <signal.h>

void handle(int signo) {
    char buf[1024] = {0};
    fgets(buf, sizeof(buf), stdin);
    printf("STDIN : %s\n", buf);
}

int main(int argc, char *argv[]) {
    signal(SIGIO, handle);
    char buf[1024] = {0};
    mkfifo("./fifo", 0666);
    int fd = open("./fifo", O_RDONLY);
    int flag = fcntl(0, F_GETFL);
    flag = flag | O_ASYNC;
    fcntl(0, F_SETFL, flag);
    fcntl(0, F_SETOWN, getpid());
    while (1) {
        memset(buf, 0, sizeof(buf));
        read(fd, buf, sizeof(buf));
        sleep(1);
        printf("%s\n", buf);
    }
    close(fd);
    return 0;
}
 

 4.3 信号驱动IO

信号驱动IO模型通过信号机制来通知数据的到达。可以减少CPU的占用率,因为系统会在数据到达时发送信号。

特点:
- 异步通知:当IO操作准备好时,系统会发送信号通知进程。
- 效率高:适合处理少量IO操作的场景。

实现步骤:
1. 增加异步属性 `O_ASYNC`。
2. 关联信号和当前进程。
3. 注册信号处理函数。

    广告一刻

    为您即时展示最新活动产品广告消息,让您随时掌握产品活动新动态!