车载音频开发(一):从看懂wav开始

avatar
作者
猴君
阅读量:0

        背景介绍:随着电车的发展势头迅猛,国内车载音频也成为电车火热宣称的势头,要想深入了解车载音频,那首先还是得从最为普通的音频文件WAV开始。

        我们都知道,计算机只能存储数字,声音确实靠不同频率的波组成,那么这些波的数据是如何存储在wav文件中的呢

        首先我们用notepad++打开一首简单的wav文件        一堆看不懂的乱码

        然后借助插件看起hex格式

这些一个个数字和字母就是该文件的全部内容了,当然,这么看还是很迷,那么我们就用专门的音频软件audition来解析这些数据,看看wav到底长什么样

用audition打开可以看到该wav有两个声道,每个声道对应着一段波形图

我们放大了看,每个波箱图上有非常多的小点,这些点就被称为采样点,只要采样点足够密,那么将这些点按先后顺序连起来,那就成了波形数据

当然,实际的wav文件的内容远不止这些,要像真正读懂wav还要接着往下看

我们先来百度一下有关wav的词条

词条上显示有三个关键词:采样频率,采样位数,声道数

采样频率:简单理解就是一秒钟有多少个小点

采样位数:简单理解就是每个小点在计算机上由多少个 0/1 来记录

声道数:就是这个这个wav有多少个声道 (除了我们大多熟悉的立体音,还有5.1,7.1.4,等其他各种各样的声道数的音源,当我们了解了wav的格式后,想要多少个声道就能有多少个声道)

接下来,我们应该知道的是 采样频率,采样位数,声道数 这些信息我们要如何知道,到底又怎么用,那我们就要去在百度再搜一搜wav文件头

知乎上说的很明白,以下就是文件头的内容

那么知道了这些,作为一个程序员就可以开始展现我们自己的专业啦

先建一个头文件的结构体

    struct WavHeader {         char chunkId[4];			//"RIFF"         uint32_t chunkSize;			//totalsize - 8         char format[4];				//"WAVE"         char subchunk1Id[4];		//"fmt"         uint32_t subchunk1Size;		//16:Normal; 18:Non_PCM; 40:Extensible;         uint16_t audioFormat; 		//wav 格式 1;int型  3:float型  65534:未知         uint16_t numChannels; 		//声道数          uint32_t sampleRate;		//采样率         uint32_t byteRate;			//比特率:采样率 * 采样位宽         uint16_t blockAlign;		//采样深度:         uint16_t bitsPerSample;		//采样位宽:采样深度 * 8         char subchunk2Id[4];		//"data"         uint32_t subchunk2Size;		//datasize     };

通过IO读取文件的数据可得到如下内容

读出了头文件的信息后,剩下的便是读取其所有数据

根据头文件信息我们知道该文件有两声道,采样率是48000,采样位数是16

那接下来我们每16 位也就是每两个字节读一次数据

数据量太大,我们就截取看一部分

这里有正有负,

对应上这里纵坐标为dB 值,那么我把把这些数据转化一下,算出每个数据对应的dB值

memcpy(&WavDate16, buffer.data() + i * headera.numChannels * perdatasize + j * perdatasize, perdatasize); printf(" %10d , %.2f db ,",  WavDate16, 20 * log10f(abs((float)WavDate16) / 32768));

 得到以下结果

接下来我们就还可以完全用代码把所有wav的数据读出来了

以下是优化好的c++代码

#include <iostream> #include <fstream> #include <vector> #include <cstring> #include <cmath>      using namespace std;      struct WavHeader {         char chunkId[4];			//"RIFF"         uint32_t chunkSize;			//totalsize - 8         char format[4];				//"WAVE"         char subchunk1Id[4];		//"fmt"         uint32_t subchunk1Size;		//16:Normal; 18:Non_PCM; 40:Extensible;     };      struct type40_header {         uint16_t audioFormat; 		//wav 格式 1;int型  3:float型  65534:未知         uint16_t numChannels; 		//声道数          uint32_t sampleRate;		//采样率         uint32_t byteRate;			//比特率:采样率 * 采样位宽         uint16_t blockAlign;		//采样深度:         uint16_t bitsPerSample;		//采样位宽:采样深度 * 8         uint16_t cbSize;         uint16_t wValidBitsPerSample;         uint32_t dwChannelMask;         char SubFormat[4];         char ckID[4];         uint32_t cksize;         uint32_t dwSampleLength;     };      struct data_header {         char subchunk2Id[4];		//"data"         uint32_t subchunk2Size;		//datasize     };      //查看头部数据     int header_check(const char* filename)     {         WavHeader header = {};         type40_header headera = {};         data_header headerb = {};          ifstream inputFile(filename, ios::binary);         if (!inputFile.is_open()) {             cerr << "无法打开文件" << endl;             return -1;         }          inputFile.read(reinterpret_cast<char*>(&header), sizeof(header));         inputFile.read(reinterpret_cast<char*>(&headera), header.subchunk1Size);         inputFile.read(reinterpret_cast<char*>(&headerb), sizeof(headerb));           //printf("\ntotalsize : \t%u \n", header.chunkSize + 8);          printf("chunkId       : ,%c%c%c%c\n", header.chunkId[0], header.chunkId[1], header.chunkId[2], header.chunkId[3]);         cout << "chunkSize     : ," << header.chunkSize << endl;          printf("format        : ,%c%c%c%c\n", header.format[0], header.format[1], header.format[2], header.format[3]);          printf("subchunk1Id   : ,%c%c%c%c\n", header.subchunk1Id[0], header.subchunk1Id[1], header.subchunk1Id[2], header.subchunk1Id[3]);         cout << "subchunk1Size : ," << header.subchunk1Size << endl;         cout << "audioFormat   : ," << headera.audioFormat << endl;         cout << "numChannels   : ," << headera.numChannels << endl;         cout << "sampleRate    : ," << headera.sampleRate << endl;         cout << "byteRate      : ," << headera.byteRate << endl;         cout << "blockAlign    : ," << headera.blockAlign << endl;         cout << "bitsPerSample : ," << headera.bitsPerSample << endl;            printf("subchunk2Id   : ,%c%c%c%c\n", headerb.subchunk2Id[0], headerb.subchunk2Id[1], headerb.subchunk2Id[2], headerb.subchunk2Id[3]);         cout << "subchunk2Size : ," << headerb.subchunk2Size << endl;           inputFile.close();         return 0;     }      int data_check(const char* filename)     {         WavHeader header = {};         type40_header headera = {};         data_header headerb = {};          ifstream inputFile(filename, ios::binary);         if (!inputFile.is_open()) {             cerr << "无法打开文件" << endl;             return -1;         }          inputFile.read(reinterpret_cast<char*>(&header), sizeof(header));         inputFile.read(reinterpret_cast<char*>(&headera), header.subchunk1Size);         inputFile.read(reinterpret_cast<char*>(&headerb), sizeof(headerb));          const size_t dataSize = headerb.subchunk2Size;         vector<char> buffer(dataSize);          inputFile.read(buffer.data(), dataSize);         uint16_t perdatasize = headera.bitsPerSample / 8;         float wavdate;         int32_t WavDate = 0;         int16_t WavDate16 = 0;         printf(",");         for (int j = 0; j < headera.numChannels; j++) {             printf("channel[%d] , ,", j + 1);         }         printf("\n");         printf("data,");         for (int j = 0; j < headera.numChannels; j++) {             printf("Frequency , Response ,");         }         printf("\n");         for (size_t i = 0; i < dataSize / perdatasize/ headera.numChannels; i++) {             //for (size_t i = 0; i < 100; i++) {                 printf("data[%8d] : ,",(unsigned int)i);                 for (size_t j = 0; j < headera.numChannels; j++) {                          if (16 == headera.bitsPerSample)                         {                             memcpy(&WavDate16, buffer.data() + i * headera.numChannels * perdatasize + j * perdatasize, perdatasize);                             printf(" %10d , %.2f db ,",  WavDate16, 20 * log10f(abs((float)WavDate16) / 32768));                         }                         else if (24 == headera.bitsPerSample)                         {                             memcpy(&WavDate, buffer.data() + i * headera.numChannels * perdatasize + j * perdatasize, perdatasize);                             printf(" %10d , %.2f db ,", (WavDate << 8) / 256, 20 * log10f(abs((float)(WavDate << 8)) / 256 / 8388608));                         }                         else if (32 == headera.bitsPerSample)                         {                             if (1 != headera.audioFormat) {                                 memcpy(&wavdate, buffer.data() + i * headera.numChannels * perdatasize + j * perdatasize, perdatasize);                                 printf(" %.6f , %.2f db ,", wavdate, 20 * log10f(abs(wavdate)));                             }                             else {                                 memcpy(&WavDate, buffer.data() + i * headera.numChannels * perdatasize + j * perdatasize, perdatasize);                                 printf(" %16d , %.2f db ,", WavDate, 20 * log10f(abs((float)WavDate) / 2147483648));                             }                          }                                      }                 cout << endl;             }         buffer.clear();          inputFile.close();         return 0;     }        int main(int argc, const char* argv[]) {          int wavnum = argc - 1;          if (1 == wavnum) {              header_check(argv[1]);             printf("\n");             data_check(argv[1]);         }          return 0;     } 

    广告一刻

    为您即时展示最新活动产品广告消息,让您随时掌握产品活动新动态!