目录
  • 前言
  • 一、使用分水岭算法分割图像
    • 1、cv2.distancetransform()函数
    • 2、cv2.connectedcomponents()函数
    • 3、cv2.watershed()函数
  • 二、图像金字塔
    • 1、高斯金字塔向下采样
    • 2、高斯金字塔向上采样
    • 3、拉普拉斯金字塔
    • 4、应用图像金字塔实现图像的分割和融合

前言

主要介绍opencv中的分水岭算法、图像金字塔对图像进行分割的方法。

一、使用分水岭算法分割图像

分水岭算法的基本原理为:将任意的灰度图像视为地形图表面,其中灰度值高的部分表示山峰和丘陵,而灰度值低的地方表示山谷。用不同颜色的水(标签)填充每个独立的山谷(局部最小值);随着水平面的上升,来自不同山谷(具有不同颜色)的水将开始合并。为了避免出现这种情况,需要在水汇合的位置建造水坝;持续填充水和建造水坝,直到所有的山峰和丘陵都在水下。整个过程中建造的水坝将作为图像分割的依据。

使用分水岭算法执行图像分割操作时通常包含下列步骤:

(1) 将原图转换为灰度图像

(2) 应用形态变换中的开运算和膨胀操作,去除图像噪声,获得图像边缘信息,确定图像背景

(3) 进行距离转换,再进行阈值处理,确定图像前景

(4) 确定图像的未知区域(用图像的背景减去前景剩余的部分)

(5) 标记背景图像

(6) 执行分水岭算法分割图像

1、cv2.distancetransform()函数

opencv中的cv2.distancetransform()函数用于计算非0值像素点到0值(背景)像素点的距离,其基本格式如下:

dst = cv2.distancetransform(src, distancetype, masksize[, dsttype])

dst为返回的距离转换结果图像

src为原图像, 必须是8为单通道二值图像

distancetype为距离类型

masksize为掩膜的大小, 可设置为0, 3或5

dsttype为返回的图像类型, 默认值为cv_32f(32位浮点数)

import cv2
import numpy as np
import matplotlib.pyplot as plt

# cv2.distancetransform()函数,计算非0值像素点到0值(背景)像素点的距离
img = cv2.imread('home.jpg')
cv2.imshow('original', img)

img_gray = cv2.cvtcolor(img, cv2.color_bgr2gray) 										# 灰度操作
cv2.imshow('gray', img_gray)

ret, thresh = cv2.threshold(img_gray, 0, 255, cv2.thresh_binary_inv + cv2.thresh_otsu) 	# 阈值操作
cv2.imshow('thresh', thresh)

kernel = np.ones((3, 3), np.uint8)
img_open = cv2.morphologyex(thresh, cv2.morph_open, kernel, iterations=2) 				# 形态学操作
cv2.imshow('open', img_open)

img_dilate = cv2.dilate(img_open, kernel, iterations=2)    								# 膨胀操作,确定背景
cv2.imshow('img_dilate', img_dilate)

img_dist = cv2.distancetransform(img_dilate , cv2.dist_l2, 5) 							# 距离转换
cv2.imshow('img_dist', img_dist)

cv2.waitkey(0)
cv2.destroyallwindows()

2、cv2.connectedcomponents()函数

opencv中的cv2.connectedcomponents()函数用于将图像中的背景标记为0,将其他图像标记为从1开始的整数,其基本格式如下:

ret, labels = cv2.connectedcomponents(image[, connectivity[, ltype]])

labels为返回的标记结果图像, 和image大小一样

image为要标记的8位单通道图像

connectivity为4或8(默认值), 表示连接性

ltype为返回的标记结果图像的类型

# cv2.connectedcomponents()函数,将图像中的背景标记为0,将其他图像标记为从1开始的整数
ret, imgfg = cv2.threshold(img_dist, 0.7*img_dist.max(), 255, cv2.thresh_trunc)

imgfg = np.uint8(imgfg)

ret, markers = cv2.connectedcomponents(imgfg)

plt.imshow(imgfg,cmap='gray')
plt.title('imgfg') 
plt.axis('off')
plt.show()

plt.imshow(markers,cmap='gray')
plt.title('markers') 
plt.axis('off')
plt.show()

3、cv2.watershed()函数

opencv中的cv2.watershed()函数用于执行分水岭算法分割图像,其基本格式如下:

ret = cv2.watershed(image, markers)

ret为返回的8位或32位单通道图像

image为输入的8位或32位单通道图像

markers为输入的32位单通道图像

# cv2.watershed()函数,执行分水岭算法分割图像
img = cv2.imread('qizi.jpg')

img_gray = cv2.cvtcolor(img, cv2.color_bgr2gray) # 灰度操作

ret, thresh = cv2.threshold(img_gray, 0, 255, cv2.thresh_binary_inv + cv2.thresh_otsu) 	# 阈值操作

kernel = np.ones((3, 3), np.uint8)
img_open = cv2.morphologyex(thresh, cv2.morph_open, kernel, iterations=2) 				# 形态学操作

img_dilate = cv2.dilate(img_open, kernel, iterations=3)               					# 膨胀操作(确定背景)

img_dist = cv2.distancetransform(img_open, cv2.dist_l2, 0)          

ret, img_fg = cv2.threshold(img_dist, 0.7*img_dist.max(), 255, 2)      					# 距离操作(确定前景)

img_fg = np.uint8(img_fg)

ret, markers = cv2.connectedcomponents(img_fg)

unknown = cv2.subtract(img_dilate, img_fg)												# 确定位置未知区域

markers = markers + 1																	# 加1使背景不为0

markers[unknown == 255] = 0																# 将未知区域设置为0

img_water = cv2.watershed(img, markers)													# 执行分水岭算法

plt.imshow(img_water, cmap='gray')
plt.title('watershed')
plt.axis('off')
plt.show()

img[img_water == -1] = [0, 255, 0]														# 将原图中的被标记点设置为绿色
cv2.namedwindow('watershed', cv2.window_normal)
cv2.imshow('watershed', img)

cv2.waitkey(0)
cv2.destroyallwindows()

二、图像金字塔

图像金字塔从分辨率的角度分析处理图像。图像金字塔的底部为原始图,对原始图像进行梯次向下采样,得到金字塔的其他各层图像。层次越高,分辨率越低,图像越小。通常,每向上一层,图像的宽度和高度就为下一层的一半。常见的图像金字塔可分为高斯金字塔和拉普拉斯金字塔。

高斯金字塔有向上和向下两种采样方式。向下采样时,原始图像为第0层,第1次向下采样的结果为第1层,第2次向下采样的结果为第2层,以此类推。每次采样图像的宽度和高度都减小为原来的一半,所有的图层构成高斯金字塔。向上采样的过程和向下采样的过程相反,每次采样图像的宽度和高度都扩大为原来的二倍。

1、高斯金字塔向下采样

opencv中的cv2.pyrdown()函数用于执行高斯金字塔构造的向下采样步骤,其基本格式如下:

ret = cv2.pyrdown(image[, dstsize[, bordertype]])

ret为返回的结果图像, 类型和输入图像相同

image为输入图像

dstsize为结果图像大小

bordertype为边界类型

# 高斯金字塔向下采样
img = cv2.imread('qizi.jpg')
img1 = cv2.pyrdown(img)
img2 = cv2.pyrdown(img1)

cv2.imshow('img', img)
cv2.imshow('img1', img1)
cv2.imshow('img2', img2)

print('0层的形状:', img.shape)
print('1层的形状:', img1.shape)
print('2层的形状:', img2.shape)

cv2.waitkey(0)
cv2.destroyallwindows()

2、高斯金字塔向上采样

opencv中的cv2.pyrup()函数用于执行高斯金字塔构造的向下采样步骤,其基本格式如下:

ret = cv2.pyrup(image[, dstsize[, bordertype]])

ret为返回的结果图像, 类型和输入图像相同

image为输入图像

dstsize为结果图像大小

bordertype为边界类型

3、拉普拉斯金字塔

拉普拉斯金字塔的第n层是该层高斯金字塔图像减去n+1层向上采样的结果获得的图像。

# 拉普拉斯金字塔
img = cv2.imread('qizi.jpg')
img1 = cv2.pyrdown(img)
img2 = cv2.pyrdown(img1)
img3 = cv2.pyrdown(img2)

imgl0 = cv2.subtract(img, cv2.pyrup(img1))
imgl1 = cv2.subtract(img1, cv2.pyrup(img2))
imgl2 = cv2.subtract(img2, cv2.pyrup(img3))

cv2.imshow('imgl0', imgl0)
cv2.imshow('imgl1', imgl1)
cv2.imshow('imgl2', imgl2)

cv2.waitkey(0)
cv2.destroyallwindows()

4、应用图像金字塔实现图像的分割和融合

# 应用图像金字塔实现图像融合
img1 = cv2.imread('jiang1.jpg')
img2 = cv2.imread('jiang2.jpg')

#生成图像1的高斯金字塔,向下采样6次
img = img1.copy()
img1gaus = [img]
for i in range(6):
    img = cv2.pyrdown(img)
    img1gaus.append(img)

#生成图像2的高斯金字塔,向下采样6次
img = img2.copy()
img2gaus = [img]
for i in range(6):
    img = cv2.pyrdown(img)
    img2gaus.append(img)

#生成图像1的拉普拉斯金字塔,6层
img1laps = [img1gaus[5]]
for i in range(5,0,-1):
    img = cv2.pyrup(img1gaus[i])
    lap = cv2.subtract(img1gaus[i-1],img)    #两个图像大小不同时,做减法会出错
    img1laps.append(lap)

#生成图像2的拉普拉斯金字塔,6层
img2laps = [img2gaus[5]]
for i in range(5,0,-1):
    img = cv2.pyrup(img2gaus[i])
    lap = cv2.subtract(img2gaus[i-1],img)
    img2laps.append(lap)

#拉普拉斯金字塔拼接:图像1每层左半部分与和图像2每层右半部分拼接
imglaps = []
for la,lb in zip(img1laps,img2laps):
    rows,cols,dpt = la.shape
    ls=la.copy()
    ls[:,int(cols/2):]=lb[:,int(cols/2):]
    imglaps.append(ls)

#从拉普拉斯金字塔恢复图像
img = imglaps[0]
for i in range(1,6):
    img = cv2.pyrup(img)
    img = cv2.add(img, imglaps[i])

#图像1原图像的半部分与和图像2原图像的右左半部分直接拼接
direct = img1.copy()
direct[:,int(cols/2):]=img2[:,int(cols/2):]
cv2.imshow('direct',direct)             #显示直接拼接结果
cv2.imshow('pyramid',img)               #显示图像金字塔拼接结果
cv2.waitkey(0)
cv2.destroyallwindows()

到此这篇关于opencv图像分割之分水岭算法与图像金字塔算法详解的文章就介绍到这了,更多相关opencv图像分割内容请搜索www.887551.com以前的文章或继续浏览下面的相关文章希望大家以后多多支持www.887551.com!