Python下OpenCV的学习(四)图像的简单几何变换

图像的简单几何变换

先看一下关于图像几何变换的简介:

几何变换不改变图像的像素值,只是在图像平面上进行像素的重新安排。

适当的几何变换可以最大程度地消除由于成像角度、透视关系乃至镜头自身原因所造成的几何失真所产生的负面影响。有利于我们在后续的处理和识别工作中将注意力集中子图像内容本身,更确切地说是图像中的对象,而不是该对象的角度和位置等。几何变换常常作为图像处理应用的预处理步骤,是图像归一化的核心工作之一。

一个几何变换需要两部分运算:首先是空间变换所需的运算,如平移、缩放、旋转和正平行投影等,需要用它来表示输出图像与输入图像之间的(像素)映射关系;此外,还需要使用灰度差值算法,因为按照这种变换关系进行计算,输出图像的像素可能被映射到输入图像的非整数坐标上。

(一)图像的平移

对于图像的平移非常简单,在平移之前,我们需要先构造一个移动矩阵,所谓移动矩阵,就是让说明白在x轴方向上移动多少距离,在y轴上移动多少距离。

通过numpy来构造这个矩阵,并将其传给仿射函数cv2.warpAffine( )

仿射函数cv2.warpAffine( )接受三个参数,需要进行图像变换的原始图像矩阵,移动矩阵以及图像变换的大小(这里要说明一下,图像本身并不会放大或缩小,而是图像显示区域的大小)

img = cv2.imread('1.jpg')
#构造移动矩阵H
#在x轴方向移动多少距离,在y轴方向移动多少距离
H = np.float32([[1, 0, 50], [0, 1, 25]])
rows, cols = img.shape[:2]
print(img.shape)
print(rows, cols)
res = cv2.warpAffine(img, H, (cols, rows)) # 注意这里rows和cols需要反置,个人感觉这里是一个坑
cv2.imshow('origin_picture', img)
cv2.imshow('new_picture', res)
cv2.waitKey(0)

(二)图像的放大和缩小

图像的放大和缩小有一个专门的函数,就是cv2.resize( ),这其中就需要设置缩放的比例,一种办法是设置缩放因子,另一种办法是直接设置图像的大小,在缩放以后,图像必然会发生变化,这就涉及到图像的插值问题。

缩放有几种不同的插值(interpolation)方法,在缩小时推荐使用cv2.INTER_AREA,扩大时推荐使用cv2.INTER_CUBIC和cv2.INTER_LINEAR。

img = cv2.imread('1.jpg')
#一是通过设置图像缩放比例,即缩放因子,来对图像进行放大或缩小
res1 = cv2.resize(img, None, fx=2, fy=2, interpolation=cv2.INTER_LINEAR)
height, width = img.shape[:2]
#二是直接设置图像的大小,不需要缩放因子
res2 = cv2.resize(img, (int(0.8*width), int(0.8*height)), interpolation=cv2.INTER_AREA)
cv2.imshow('origin_picture', img)
cv2.imshow('res1', res1)
cv2.imshow('res2', res2)
cv2.waitKey(0)

关于插值算法有很多,一个例子:

最近邻插值算法:选择离它映射到的位置最近的输入像素的灰度值为插值结果。

通过图像长和宽的比例,将原有的图像映射到所需要的图像上。这里涉及到对图像矩阵元素的操作,对于其如何计算的可以看代码,别联系我,我也不懂,我在网上找的看的。

# need_height参数不得超过原来图像高的两倍,这是由临近插值算法本身的性质所决定的
# need_width参数则可以任意选取
def pic_interpolation(img, need_height, need_width):
    height, width, channels = img.shape
    print(height, width, channels)
    emptyImage = np.zeros((need_height, need_width, channels), np.uint8)
    sh = need_height/height
    sw = need_width/width
    for i in range(need_height):
        for j in range(need_width):
            x = round(i/sh)
            y = math.floor(j/sw)
            emptyImage[i, j] = img[x, y]
    return emptyImage
 
 
img = cv2.imread("1.jpg")
zoom = pic_interpolation(img, 220, 180)
cv2.imshow("nearest neighbor", zoom)
cv2.imshow("image", img)
cv2.waitKey(0)