图像处理基础

凌虚 included in Uncate

2019-02-26 1401 words 3 minutes

Contents

图像处理基础

现如今我们每时每刻都在与图像打交道，而图像处理也是我们绕不开的问题，本文将会简述图像处理的基础知识以及对常见的裁剪、画布、水印、平移、旋转、缩放等处理的实现。

在进行图像处理之前，我们必须要先回答这样一个问题：什么是图像？

答案是像素点的集合。

如上图所示，假设红色圈的部分是一幅图像，其中每一个独立的小方格就是一个像素点（简称像素），像素是最基本的信息单元，而这幅图像的大小就是 11 x 11 px 。

1、二值图像：

图像中的每个像素点只有黑白两种状态，因此每个像素点的信息可以用 0 和 1 来表示。

2、灰度图像：

图像中的每个像素点在黑色和白色之间还有许多级的颜色深度（表现为灰色），通常我们使用 8 个 bit 来表示灰度级别，因此总共有 2 ^ 8 = 256 级灰度，所以可以使用 0 到 255 范围内的数字来对应表示灰度级别。

3、RGB图像：

红（Red）、绿（Green）、蓝（Blue）作为三原色可以调和成任意的颜色，对于 RGB 图像，每个像素点包含 RGB 共三个通道的基本信息，类似的，如果每个通道用 8 bit 表示即 256 级灰度，那么一个像素点可以表示为：

1

([0 ... 255], [0 ... 255], [0 ... 255])

图像矩阵：

每个图像都可以很自然的用矩阵来表示，每个像素对应矩阵中的每个元素。

例如：

1、4 x 4 二值图像：

1
2
3
4


0   1   0   1
1   0   0   0
1   1   1   1
0   0   0   0

2、4 x 4 灰度图像：

1
2
3
4


156   255   0     14
12    78    94    134
240   55    1     11
0     4     50    100

3、4 x 4 RGB 图像：

1
2
3
4


(156, 22, 45)   (255, 0, 0)     (0, 156, 32)    (14, 2, 90)
(12, 251, 88)   (78, 12, 34)    (94, 90, 87)    (134, 0, 2)
(240, 33, 44)   (55, 66, 77)    (1, 28, 167)    (11, 11, 11)
(0, 0, 0)       (4, 4, 4)       (50, 50, 50)    (100, 10, 10)

在编程语言中使用哪种数据类型来表示矩阵？答案是多维数组。例如上述 4 x 4 RGB 图像可转换为：

1
2
3
4
5
6


[
    [ (156, 22, 45), (255, 0, 0),  (0, 156, 32),  (14, 2, 90)   ],
    [ (12, 251, 88), (78, 12, 34), (94, 90, 87),  (134, 0, 2)   ],
    [ (240, 33, 44), (55, 66, 77), (1, 28, 167),  (11, 11, 11)  ],
    [ (0, 0, 0),     (4, 4, 4),    (50, 50, 50),  (100, 10, 10) ]
]

图像处理的本质实际上就是在处理像素矩阵即像素多维数组运算。

基本处理实现

对于图像的基本处理，本文示例使用的是 opencv-python 和 numpy 库。

示例：

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41


# -*- coding: utf-8 -*-

# 图像处理
import numpy as np
import cv2 as cv

img = cv.imread('../images/cat.jpg')  # 333 x 500
rows, cols, channels = img.shape

# 1、裁剪：切割矩阵
cut = img[100:200, 333:444]  # 选取第100到200行，第333到444列的区间


# 2、画布：填充矩阵
background = np.zeros((600, 600, 3), dtype=np.uint8)  # 创建 600 x 600 黑色画布
background[100:433, 50:550] = img  # 画布指定区域填充图像


# 3、水印：合并矩阵
# addWeighted 参数：src1, alpha, src2, beta, gamma
# dst = src1 * alpha + src2 * beta + gamma;
watermark = cv.imread('../images/node.jpg') # 600 x 800
watermark = watermark[200:533, 200:700];
dst = cv.addWeighted(watermark, 0.3, img, 0.7, 0); # 确保相同的 size 和 channel


# 4、平移
# shift (x, y), 构建平移变换矩阵 M: [[1, 0, tx], [0, 1, ty]], 缺省部分填充黑色
M = np.array([[1, 0, -100], [0, 1, 100]], dtype=np.float32)
shift = cv.warpAffine(img, M, (cols, rows))


# 5、旋转
# getRotationMatrix2D 参数： center 中心点，angle 旋转角度，scale 缩放
M = cv.getRotationMatrix2D(((cols-1)/2.0, (rows-1)/2.0), -60, 1)
rotation = cv.warpAffine(img, M, (cols, rows))


# 6、缩放
# resize 参数：src 输入图像，dsize 输出图片大小，dst 输出图像，fx 水平方向缩放，fy 垂直方向缩放，interpolation 缩放算法
resize = cv.resize(img, None, fx = 2, fy = 2, interpolation = cv.INTER_LINEAR)

裁剪：切割矩阵即可。
画布：先构建指定大小的画布背景，再填充图像即可。
水印：矩阵合并运算，使用 cv : addWeighted 方法。
平移：构建平移变换矩阵，使用 cv : warpAffine 方法。
旋转：构建旋转变换矩阵，使用 cv : warpAffine 方法。
缩放：使用 cv : resize 方法。

OpenCV 提供的 resize 缩放算法包括：

根据官方的文档，缩小图像时建议使用 INTER_AREA 算法，放大图像时建议使用 INTER_CUBIC（较慢）算法或者 INTER_LINEAR（更快效果也不错）算法。

结语

本文介绍了图像处理的基础，以及通过 OpenCV 实现了几种常见的图像处理功能。