嵌入式人工智能应用-第三章 opencv操作2_业界新闻

发布时间:2024-07-17 18:20

阅读量:3

1 色彩空间与图像表示

1.1 背景介绍

色彩是人的眼睛对于不同频率的光线的不同感受，色彩既是客观存在的（不同频率的光）又是主观感
知的，有认识差异。所以人类对于色彩的认识经历了极为漫长的过程，直到近代才逐步完善起来，但至今，人类仍不能说对色彩完全了解并准确表述了，许多概念不是那么容易理解。“色彩空间”一词源于西方的“Color Space”，又称作“色域”，色彩学中，人们建立了多种色彩模型，以一维、二维、三维甚至四维空间坐标来表示某一色彩，这种坐标系统所能定义的色彩范围即色彩空间。我们经常用到的色彩空间主要有 RGB、CMYK、Lab 等。

1.1.1 RGB

RGB 色彩模式是工业界的一种颜色标准，是通过对红®、绿(G)、蓝(B)三个颜色通道的变化以及它们
相互之间的叠加来得到各式各样的颜色的，RGB 即是代表红、绿、蓝三个通道的颜色。RGB 是opencv 图像加载时默认的色彩空间。默认的图像通道顺序为 BGR。

色彩混合的基本定律表明：自然界任何一种色彩均可用红、绿、蓝三种原色光混合产生，这在几何上
能够以 R、G、B 三个互相垂直的轴所构成的空间坐标系统来表示，称为 RGB 色彩空间。如图 2.3.2 所示，RGB 色系坐标中三维空间的三个轴分别于红、绿、蓝三基色相对应，原点对应黑色，离原点最远的顶点对应白色，而立方体内其余各点对应不同的颜色。RGB 色彩系统用 R、G、B 三原色通过不同比例的混合来表示任一种色彩，因而它不能直观地度量色调、饱和度和亮度。而且，各分量之间存在着一定的相关性，它们在大多数情况下都是成正比的，主要表现为自然场景中若某一通道大，则像素的其他通道值也较大。
这意味着，如果要对图像的色彩进行处理，常常需要对像素的三个分量同时进行修改才不会影响图像的真实感，这将大大增加颜色调整过程的复杂性。因此，在 RGB 色彩空间下进行色彩迁移会比较复杂，得到的视觉效果也不自然。

1.1.2 YUV

在现代彩色电视系统中，通常采用三管彩色摄影机或彩色 CCD 摄影机进行取像，然后把取得的彩色
图像信号经分色、分别放大校正后得到 RGB，再经过矩阵变换电路得到亮度信号 Y 和两个色差信号 B－Y（即 U）、R－Y（即 V），最后发送端将亮度和色差三个信号分别进行编码，用同一信道发送出去。这种色彩的表示方法就是所谓的 YUV 色彩空间表示。采用 YUV 色彩空间的重要性是它的亮度信号 Y 和色度信号 U、V 是分离的，便于对亮度和色彩分别进行处理。
YUV 与 YCrCb 的区别：YCrCb 颜色空是由 YUV 颜色空间派生的一种颜色空间。YCbCr 是在世界数
字组织视频标准研制过程中作为 ITU-R BT.601 建议的一部分，其实是 YUV 经过缩放和偏移的翻版。YCrCb 中的 Y 与 YUV 中的 Y 含义一致，Cb、Cr 同样都指色彩，只是在表示方法上不同。YCbCr 中，Y 是指亮度分量，Cb 指蓝色色度分量，而 Cr 指红色色度分量。在 YUV 家族中，YCbCr 是在计算机系统中应用最多的成员，其应用领域很广泛，JPEG、MPEG 均采用此格式。一般人们所讲的 YUV 大多是指 YCbCr。上面我们提到的 Camera 驱动、应用开发会遇到 RGB565 转 RGB888 等情况，其实更多的还是 YUV 与 RGB 的转换，下面是 YUV 与 RGB 的互换公式：

Y = 0.299R + 0.587G+ 0.114B U = -0.147R -0.289G + 0.436B V = 0.615R - 0.515G- 0.100B -------------------------------------------------------- R = Y + 1.14V G = Y - 0.39U -0.58V B = Y + 2.03U

YUV 主要采样格式： YCbCr 4:2:0、YCbCr 4:2:2、YCbCr 4:1:1 和 YCbCr 4:4:4。
(1)、YUV 4:4:4：无压缩，YUV 三个信道的抽样率相同，因此在生成的图像里，每个象素的三个分
量信息完整(每个分量通常 8 比特)，经过 8 比特量化之后，未经压缩的每个像素占用 3 个字节。

下面的四个像素为: [Y0 U0 V0] [Y1 U1 V1] [Y2 U2 V2] [Y3 U3 V3] 存放的码流为: Y0 U0 V0 Y1 U1 V1 Y2 U2 V2 Y3 U3 V3

(2)、YUV 4:2:2:压缩 33.3%，每个色差信道的抽样率是亮度信道的一半，所以水平方向的色度抽样率
只是 4:4:4 的一半。对非压缩的 8 比特量化的图像来说，每个由两个水平方向相邻的像素组成的宏像素需要占用 4 字节内存。

下面的四个像素为：[Y0 U0 V0] [Y1 U1 V1] [Y2 U2 V2] [Y3 U3 V3] 存放的码流为：   Y0 U0 Y1 V1 Y2U2 Y3 V3 映射出像素点为：[Y0 U0 V1] [Y1 U0 V1] [Y2 U2 V3] [Y3 U2 V3]

(3)、YUV 4:1:1: 压缩 50%，4:1:1 的色度抽样，是在水平方向上对色度进行 4:1 抽样。对于低端用户
和消费类产品这仍然是可以接受的。对非压缩的 8 比特量化的视频来说，每个由 4 个水平方向相邻的像素组成的宏像素需要占用 6 字节内存。
每个点保存一个 8bit 的亮度值(也就是 Y 值)，每 2x2 个点保存一个 Cr 和 Cb 值，图像在肉眼中的感觉
不会起太大的变化。所以，原来用 RGB(R，G，B 都是 8bit unsigned)模型，1 个点需要 8x3=24bits，(全采样后，YUV 仍各占 8bit)。按 4:1:1 采样后，而现在平均仅需要 8+(8/4)+(8/4)=12bits(4 个点，8*4(Y)+8(U)+8(V)=48bits）, 平均每个点占 12bits。这样就把图像的数据压缩了一半。

下面的四个像素为: [Y0 U0 V0] [Y1 U1 V1] [Y2 U2 V2] [Y3 U3 V3] 存放的码流为: Y0 U0 Y1 Y2 V2 Y3 映射出像素点为：[Y0 U0 V2] [Y1 U0 V2] [Y2 U0 V2] [Y3 U0 V2]

(4)、YUV4:2:0: 压缩 50%，4:2:0 并不意味着只有 Y、Cb 而没有 Cr 分量。它指得是对每行扫描线来说，只有一种色度分量以 2:1 的抽样率存储。相邻的扫描行存储不同的色度分量，也就是说，如果一行是 4:2:0的话，下一行就是 4:0:2，再下一行是 4:2:0…以此类推。对每个色度分量来说，水平方向和竖直方向的抽样率都是 2:1，所以可以说色度的抽样率是 4:1。对非压缩的 8 比特量化的视频来说，每个由 2x2 个 2 行 2 列相邻的像素组成的宏像素需要占用 6 字节内存。绝大多数视频编解码器都采用这种格式作为标准的输入格式。

下面八个像素为：[Y0 U0 V0] [Y1 U1 V1] [Y2 U2 V2] [Y3 U3 V3]               [Y5 U5 V5] [Y6 U6 V6] [Y7 U7 V7] [Y8 U8 V8] 存放的码流为：  Y0 U0 Y1 Y2 U2 Y3 Y5 V5 Y6 Y7 V7 Y8 映射出的像素点为：[Y0 U0 V5] [Y1 U0 V5] [Y2 U2 V7] [Y3 U2 V7]                 [Y5 U0 V5] [Y6 U0 V5] [Y7 U2 V7] [Y8 U2 V7]

1.1.3 HSV

RGB 是对机器很友好的色彩模式，但并不够人性化，因为我们对色彩的认识往往是”什么颜色？鲜艳
不鲜艳？亮还是暗？”。
HSV(Hue，Saturation，Value)是根据颜色的直观特性由 A.R.Smith 在 1978 年创建的一种颜色空间，也称六角锥体模型(Hexcone Model)。HSL 和 HSV(HSB) 都是基于 RGB 的，是作为一个更方便友好的方法创建出来的。HSB 为色相，饱和度，明度；HSL 为色相，饱和度，亮度，HSV 为色相，饱和度，明度。HSB 和 HSV 是一样的，只是叫法不同，HSL 则还有一些细微的区别：在所有的情况下，H(Hue) 代表色相，S(Saturation) 代表饱和度。Hue（色相）是指取值范围在 0-360°的圆心角，每个角度可以代表一种颜色。B 在 HSB 模式中是 Brightness 的意思, V 在 HSV 中是值，但是所表述的是一个东西：对光的量或光源的功率的感知。色相(H)和明度（值）(V/B)可以在 0-1 或者 0%-100%间取值。HSL 稍微有一些不同，Hue（色相）和 HSB/HSV 模式中一样用数值表示，但是，S，同样代表“饱和度”，定义不一样，且需要转换。L 代表亮度，和 Brightness/Value 不一样。Brightness（明度）是被认为是”光的量“，可以是任何颜色。而 Lightness（亮度）是作为”白的量“来理解的。

2 实验步骤

2.1 彩色图像变成灰度图像

coding: utf-8

import cv2 import numpy as np def rgb2gray_mean(img): ratio = 1.0 / 3 int_img = img.astype(np.int32) result = ratio * (int_img[...,0]+int_img[...,1]+int_img[...,2]) return result.astype(np.uint8) def main(): color = cv2.imread('./cyq.jpg') gray = rgb2gray_mean(color) cv2.imshow('color', color) cv2.imshow('gray', gray) cv2.waitKey(0) if __name__ == '__main__': main()

2.2 RGB TO HSV

import cv2 import numpy as np def main(): color = cv2.imread('./cyq.jpg') hsv = cv2.cvtColor(color,cv2.COLOR_BGR2HSV) hsvChannels = cv2.split(hsv) cv2.imshow("Hue",hsvChannels[0]) cv2.imshow("Saturation",hsvChannels[1]) cv2.imshow("Value",hsvChannels[2]) cv2.imshow('color', color) cv2.waitKey(0) if __name__ == '__main__': main()

HSV 各个分量的差别是很大的，这对于人类来说可能不太好看，但对颜色空间的图像进行有效地处理都是在 HSV 空间进行的。对于基本色中对应的 HSV 分量需要给定一个严格的范围，下面是通过实验计算的模糊范围。

就可以对原始图像进行分析处理，例如巡线、颜色识别，车辆识别等，可以根据特定的目标进行检测。