从零开始写一个RTSP服务器（三）RTP传输H.264_业界新闻

发布时间:2024-08-07 01:00

阅读量:0

一、RTP封装

1.1 RTP数据结构

RTP包格式前面已经比较详细的介绍过，参考从零开始写一个RTSP服务器（一）不一样的RTSP协议讲解

看一张RTP头的格式图回忆一下

每个RTP包都包含这样一个RTP头部和RTP数据，为了方便，我将这个头部封装成一个结构体，还有发送包封装成一个函数，下面来看一看

RTP头结构体

/* * 作者：_JT_ * 博客：https://blog.csdn.net/weixin_42462202 */   struct RtpHeader  {      /* byte 0 */      uint8_t csrcLen:4;      uint8_t extension:1;      uint8_t padding:1;      uint8_t version:2;        /* byte 1 */      uint8_t payloadType:7;      uint8_t marker:1;            /* bytes 2,3 */      uint16_t seq;            /* bytes 4-7 */      uint32_t timestamp;            /* bytes 8-11 */      uint32_t ssrc;  };

其中的:n是一种位表示法，这个结构体跟RTP的头部一一对应

RTP的发包函数
RTP包

struct RtpPacket {     struct RtpHeader rtpHeader;     uint8_t payload[0]; };

这是我封装的一个RTP包，包含一个RTP头部和RTP载荷，uint8_t payload[0]并不占用空间，它表示rtp头部接下来紧跟着的地址，灵活数组成员 payload[0] 在结构体中的作用是为了实现动态长度的数组，动态长度的意思是数组的长度在运行时确定，而不是在编译时确定。

RTP的发包函数

/*  * 函数功能：发送RTP包  * 参数 socket：表示本机的udp套接字  * 参数 ip：表示目的ip地址  * 参数 port：表示目的的端口号  * 参数 rtpPacket：表示rtp包  * 参数 dataSize：表示rtp包中载荷的大小  * 放回值：发送字节数  */ int rtpSendPacket(int socket, char* ip, int16_t port, struct RtpPacket* rtpPacket, uint32_t dataSize) {     struct sockaddr_in addr;     int ret;      addr.sin_family = AF_INET;     addr.sin_port = htons(port);     addr.sin_addr.s_addr = inet_addr(ip);      rtpPacket->rtpHeader.seq = htons(rtpPacket->rtpHeader.seq);     rtpPacket->rtpHeader.timestamp = htonl(rtpPacket->rtpHeader.timestamp);     rtpPacket->rtpHeader.ssrc = htonl(rtpPacket->rtpHeader.ssrc);      ret = sendto(socket, (void*)rtpPacket, dataSize+RTP_HEADER_SIZE, 0,                     (struct sockaddr*)&addr, sizeof(addr));      rtpPacket->rtpHeader.seq = ntohs(rtpPacket->rtpHeader.seq);     rtpPacket->rtpHeader.timestamp = ntohl(rtpPacket->rtpHeader.timestamp);     rtpPacket->rtpHeader.ssrc = ntohl(rtpPacket->rtpHeader.ssrc);      return ret; }

仔细看这个函数你应该可以看懂

我们设置好一个包之后，就会调用这个函数发送指定目标

这个函数中多处使用htons等函数，是因为RTP是采用网络字节序（大端模式），所以要将主机字节字节序转换为网络字节序

下面给出源码，rtp.h和rtp.c，这两个文件在后面讲经常使用

1.2 源码

rtp.h

/*  * 作者：_JT_  * 博客：https://blog.csdn.net/weixin_42462202  */   #ifndef _RTP_H_ #define _RTP_H_ #include <stdint.h>  #define RTP_VESION              2  #define RTP_PAYLOAD_TYPE_H264   96 #define RTP_PAYLOAD_TYPE_AAC    97  #define RTP_HEADER_SIZE         12 #define RTP_MAX_PKT_SIZE        1400  /*  *  *    0                   1                   2                   3  *    7 6 5 4 3 2 1 0|7 6 5 4 3 2 1 0|7 6 5 4 3 2 1 0|7 6 5 4 3 2 1 0  *   +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+  *   |V=2|P|X|  CC   |M|     PT      |       sequence number         |  *   +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+  *   |                           timestamp                           |  *   +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+  *   |           synchronization source (SSRC) identifier            |  *   +=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+  *   |            contributing source (CSRC) identifiers             |  *   :                             ....                              :  *   +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+  *  */ struct RtpHeader {     /* byte 0 */     uint8_t csrcLen:4;     uint8_t extension:1;     uint8_t padding:1;     uint8_t version:2;      /* byte 1 */     uint8_t payloadType:7;     uint8_t marker:1;          /* bytes 2,3 */     uint16_t seq;          /* bytes 4-7 */     uint32_t timestamp;          /* bytes 8-11 */     uint32_t ssrc; };  struct RtpPacket {     struct RtpHeader rtpHeader;     uint8_t payload[0]; };  void rtpHeaderInit(struct RtpPacket* rtpPacket, uint8_t csrcLen, uint8_t extension,                     uint8_t padding, uint8_t version, uint8_t payloadType, uint8_t marker,                    uint16_t seq, uint32_t timestamp, uint32_t ssrc); int rtpSendPacket(int socket, char* ip, int16_t port, struct RtpPacket* rtpPacket, uint32_t dataSize);  #endif //_RTP_H_

rtp.c

/*  * 作者：_JT_  * 博客：https://blog.csdn.net/weixin_42462202  */   #include <sys/types.h> #include <sys/socket.h> #include <arpa/inet.h> #include <netinet/in.h> #include <arpa/inet.h>  #include "rtp.h"  void rtpHeaderInit(struct RtpPacket* rtpPacket, uint8_t csrcLen, uint8_t extension,                     uint8_t padding, uint8_t version, uint8_t payloadType, uint8_t marker,                    uint16_t seq, uint32_t timestamp, uint32_t ssrc) {     rtpPacket->rtpHeader.csrcLen = csrcLen;     rtpPacket->rtpHeader.extension = extension;     rtpPacket->rtpHeader.padding = padding;     rtpPacket->rtpHeader.version = version;     rtpPacket->rtpHeader.payloadType =  payloadType;     rtpPacket->rtpHeader.marker = marker;     rtpPacket->rtpHeader.seq = seq;     rtpPacket->rtpHeader.timestamp = timestamp;     rtpPacket->rtpHeader.ssrc = ssrc; }  int rtpSendPacket(int socket, char* ip, int16_t port, struct RtpPacket* rtpPacket, uint32_t dataSize) {     struct sockaddr_in addr;     int ret;      addr.sin_family = AF_INET;     addr.sin_port = htons(port);     addr.sin_addr.s_addr = inet_addr(ip);      rtpPacket->rtpHeader.seq = htons(rtpPacket->rtpHeader.seq);     rtpPacket->rtpHeader.timestamp = htonl(rtpPacket->rtpHeader.timestamp);     rtpPacket->rtpHeader.ssrc = htonl(rtpPacket->rtpHeader.ssrc);      ret = sendto(socket, (void*)rtpPacket, dataSize+RTP_HEADER_SIZE, 0,                     (struct sockaddr*)&addr, sizeof(addr));      rtpPacket->rtpHeader.seq = ntohs(rtpPacket->rtpHeader.seq);     rtpPacket->rtpHeader.timestamp = ntohl(rtpPacket->rtpHeader.timestamp);     rtpPacket->rtpHeader.ssrc = ntohl(rtpPacket->rtpHeader.ssrc);      return ret; }

二、H.264的RTP打包

2.1 H.264格式

H.264由一个一个的NALU组成，每个NALU之间使用00 00 00 01或00 00 01分隔开

每个NALU的第一次字节都有特殊的含义，其内容如下

好，对于H.264格式了解这么多就够了，我们的目的是想从一个H.264的文件中将一个一个的NALU提取出来，然后封装成RTP包，下面介绍如何将NALU封装成RTP包

2.2 H.264的RTP打包方式

H.264可以由三种RTP打包方式

单NALU打包

一个RTP包包含一个完整的NALU

聚合打包

对于较小的NALU，一个RTP包可包含多个完整的NALU

分片打包

对于较大的NALU，一个NALU可以分为多个RTP包发送

注意：这里要区分好概念，每一个RTP包都包含一个RTP头部和RTP荷载，这是固定的。而H.264发送数据可支持三种RTP打包方式

比较常用的是单NALU打包和分片打包，本文也只介绍这两种

单NALU打包
所谓单NALU打包就是将一整个NALU的数据放入RTP包的载荷中

这是最简单的一种方式，无需过多的讲解

分片打包
每个RTP包都有大小限制的，因为RTP一般都是使用UDP发送，UDP没有流量控制，所以要限制每一次发送的大小，所以如果一个NALU的太大，就需要分成多个RTP包发送，如何分成多个RTP包，下面来好好讲一讲

首先要明确，RTP包的格式是绝不会变的，永远多是RTP头+RTP载荷

RTP头部是固定的，那么只能在RTP载荷中去添加额外信息来说明这个RTP包是表示同一个NALU

如果是分片打包的话，那么在RTP载荷开始有两个字节的信息，然后再是NALU的内容

第一个字节位FU Indicator，其格式如下

高三位（0 1 2）：与NALU第一个字节的高三位相同

Type：28，表示该RTP包一个分片，为什么是28？因为H.264的规范中定义的，此外还有许多其他Type，这里不详讲，代码表示方式如下：

 rtpPacket->payload[0] = (naluType & 0x60) | 28;

第二个字节位FU Header，其格式如下

S：标记该分片打包的第一个RTP包，只有第一个包的最高位被置1

E：比较该分片打包的最后一个RTP包，最后一个包第二高位被置1

Type：NALU的Type

代码表示如下：

rtpPacket->payload[1] = naluType & 0x1F;              if (i == 0) //第一包数据    rtpPacket->payload[1] |= 0x80; // start else if (remainPktSize == 0 && i == pktNum - 1) //最后一包数据    rtpPacket->payload[1] |= 0x40; // end

2.3 H.264 RTP包的时间戳计算

RTP包的时间戳起始值是随机的

RTP包的时间戳增量怎么计算？

假设时钟频率为90000，帧率为25

频率为90000表示一秒用90000点来表示

帧率为25，那么一帧就是1/25秒

所以一帧有90000*(1/25)=3600个点来表示

因此每一帧数据的时间增量为3600

2.4 源码

rtp_h264.c
这里给出rtp发送H.264的源码

/*  * 作者：_JT_  * 博客：https://blog.csdn.net/weixin_42462202  * 注释添加：call_me_wangcheng  */   #include <stdio.h> #include <stdlib.h> #include <sys/types.h> #include <sys/socket.h> #include <sys/stat.h> #include <fcntl.h> #include <unistd.h> #include <string.h>  #include "rtp.h"  #define H264_FILE_NAME  "test.h264" #define CLIENT_IP       "127.0.0.1" //运行可执行程序设备的IP地址（可执行程序就是这个编译后的程序） #define CLIENT_PORT     9832        //端口号  #define FPS             25  static inline int startCode3(char* buf) {     if(buf[0] == 0 && buf[1] == 0 && buf[2] == 1)         return 1;     else         return 0; }  static inline int startCode4(char* buf) {     if(buf[0] == 0 && buf[1] == 0 && buf[2] == 0 && buf[3] == 1)         return 1;     else         return 0; }  static char* findNextStartCode(char* buf, int len) {     int i;      if(len < 3)         return NULL;      for(i = 0; i < len-3; ++i)     {         if(startCode3(buf) || startCode4(buf))             return buf;                  ++buf;     }      if(startCode3(buf))         return buf;      return NULL; }  static int getFrameFromH264File(int fd, char* frame, int size) {     int rSize, frameSize;     char* nextStartCode;      if(fd < 0)         return fd;      rSize = read(fd, frame, size);     if(!startCode3(frame) && !startCode4(frame))         return -1;          nextStartCode = findNextStartCode(frame+3, rSize-3);     if(!nextStartCode)     {         lseek(fd, 0, SEEK_SET);         frameSize = rSize;     }     else     {         frameSize = (nextStartCode-frame);         lseek(fd, frameSize-rSize, SEEK_CUR);     }      return frameSize; }  static int createUdpSocket() {     int fd;     int on = 1;      fd = socket(AF_INET, SOCK_DGRAM, 0);     if(fd < 0)         return -1;      setsockopt(fd, SOL_SOCKET, SO_REUSEADDR, (const char*)&on, sizeof(on));      return fd; }  static int rtpSendH264Frame(int socket, char* ip, int16_t port,                             struct RtpPacket* rtpPacket, uint8_t* frame, uint32_t frameSize) {     uint8_t naluType; // nalu第一个字节     int sendBytes = 0;     int ret;      naluType = frame[0];      if (frameSize <= RTP_MAX_PKT_SIZE) // nalu长度小于最大包场：单一NALU单元模式     {         /*          *   0 1 2 3 4 5 6 7 8 9          *  +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+          *  |F|NRI|  Type   | a single NAL unit ... |          *  +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+          */         memcpy(rtpPacket->payload, frame, frameSize);         ret = rtpSendPacket(socket, ip, port, rtpPacket, frameSize);         if(ret < 0)             return -1;          rtpPacket->rtpHeader.seq++;         sendBytes += ret;         if ((naluType & 0x1F) == 7 || (naluType & 0x1F) == 8) // 如果是SPS、PPS就不需要加时间戳             goto out;     }     else // nalu长度小于最大包场：分片模式     {         /*          *  0                   1                   2          *  0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3          * +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+          * | FU indicator  |   FU header   |   FU payload   ...  |          * +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+          */          /*          *     FU Indicator          *    0 1 2 3 4 5 6 7          *   +-+-+-+-+-+-+-+-+          *   |F|NRI|  Type   |          *   +---------------+          */          /*          *      FU Header          *    0 1 2 3 4 5 6 7          *   +-+-+-+-+-+-+-+-+          *   |S|E|R|  Type   |          *   +---------------+          */          int pktNum = frameSize / RTP_MAX_PKT_SIZE;       // 有几个完整的包         int remainPktSize = frameSize % RTP_MAX_PKT_SIZE; // 剩余不完整包的大小         int i, pos = 1;          /* 发送完整的包 */         for (i = 0; i < pktNum; i++)         {             rtpPacket->payload[0] = (naluType & 0x60) | 28;             rtpPacket->payload[1] = naluType & 0x1F;                          if (i == 0) //第一包数据                 rtpPacket->payload[1] |= 0x80; // start             else if (remainPktSize == 0 && i == pktNum - 1) //最后一包数据                 rtpPacket->payload[1] |= 0x40; // end             //因为payload[1]已经包含了nalu_type，所以frame的地址需要加一，因为分隔符后的第一个字节表示nalu_type             memcpy(rtpPacket->payload+2, frame+pos, RTP_MAX_PKT_SIZE);             ret = rtpSendPacket(socket, ip, port, rtpPacket, RTP_MAX_PKT_SIZE+2);             if(ret < 0)                 return -1;              rtpPacket->rtpHeader.seq++;             sendBytes += ret;             pos += RTP_MAX_PKT_SIZE;         }          /* 发送剩余的数据 */         if (remainPktSize > 0)         {             rtpPacket->payload[0] = (naluType & 0x60) | 28;             rtpPacket->payload[1] = naluType & 0x1F;             rtpPacket->payload[1] |= 0x40; //end             //原博主提供的代码这里进行了+2操作，按照我的理解-1都行，有懂得，在评论区教教我             memcpy(rtpPacket->payload+2, frame+pos, remainPktSize+2);             ret = rtpSendPacket(socket, ip, port, rtpPacket, remainPktSize+2);             if(ret < 0)                 return -1;              rtpPacket->rtpHeader.seq++;             sendBytes += ret;         }     }  out:      return sendBytes; }  int main(int argc, char* argv[]) {     int socket;     int fd;     int fps = 25;     int startCode;     struct RtpPacket* rtpPacket;     uint8_t* frame;     uint32_t frameSize;      fd = open(H264_FILE_NAME, O_RDONLY);     if(fd < 0)     {         printf("failed to open %s\n", H264_FILE_NAME);         return -1;     }      socket = createUdpSocket();     if(socket < 0)     {         printf("failed to create socket\n");         return -1;     }      rtpPacket = (struct RtpPacket*)malloc(500000);     frame = (uint8_t*)malloc(500000);      rtpHeaderInit(rtpPacket, 0, 0, 0, RTP_VESION, RTP_PAYLOAD_TYPE_H264, 0,                     0, 0, 0x88923423);      while(1)     {         frameSize = getFrameFromH264File(fd, frame, 500000);         if(frameSize < 0)         {             printf("read err\n");             continue;         }          if(startCode3(frame))             startCode = 3;         else             startCode = 4;          frameSize -= startCode;         rtpSendH264Frame(socket, CLIENT_IP, CLIENT_PORT,                             rtpPacket, frame+startCode, frameSize);         rtpPacket->rtpHeader.timestamp += 90000/FPS;          usleep(1000*1000/fps);     }      free(rtpPacket);     free(frame);      return 0; }

三、H.264 RTP打包的sdp描述

sdp文件有什么用？

sdp描述着媒体信息，当使用vlc打开这个sdp文件后，会根据这些信息做相应的操作（创建套接字…）,然后等待接收RTP包

这里给出RTP打包H.264的sdp文件，并描述每一行是什么意思

m=video 9832 RTP/AVP 96  a=rtpmap:96 H264/90000 a=framerate:25 c=IN IP4 127.0.0.1

这个一个媒体级的sdp描述，关于sdp文件描述详情可看从零开始写一个RTSP服务器（一）不一样的RTSP协议讲解

m=video 9832 RTP/AVP 96

格式为 m=<媒体类型> <端口号> <传输协议> <媒体格式 >
媒体类型：video，表示这是一个视频流

端口号：9832，表示UDP发送的目的端口为9832

传输协议：RTP/AVP，表示RTP OVER UDP，通过UDP发送RTP包

媒体格式：表示负载类型(payload type)，一般使用96表示H.264

a=rtpmap:96 H264/90000

格式为a=rtpmap:<媒体格式><编码格式>/<时钟频率>

a=framerate:25

表示帧率

c=IN IP4 127.0.0.1

IN：表示internet

IP4：表示IPV4

127.0.0.1：表示UDP发送的目的地址为127.0.0.1

特别注意：这段sdp文件描述的udp发送的目的IP为127.0.0.1，目的端口为9832

四、测试

讲上面给出的源码rtp.c、rtp.h、rtp_h264.c保存下来，然后编译运行

注意：该程序默认打开的是test.h264，如果你没有视频源，可以从RtspServer的example目录下获取

gcc rtp.c rtp_h264.c ./a.out

讲上面的sdp文件保存为rtp_h264.sdp，使用vlc打开，即可观看到视频

运行效果

至此，我们已经完成了RTSP协议交互和RTP打包H.264，下一篇文章就可以来实现一个播放H.264的RTSP服务器了

原文链接：http://t.csdnimg.cn/svr1b

支持

资讯

从零开始写一个RTSP服务器（三）RTP传输H.264

目录

一、RTP封装

1.1 RTP数据结构

1.2 源码

二、H.264的RTP打包

2.1 H.264格式

2.2 H.264的RTP打包方式

2.3 H.264 RTP包的时间戳计算

2.4 源码

三、H.264 RTP打包的sdp描述

四、测试

相关阅读

广告一刻