时间:2022-10-27 10:45:23 | 栏目:Python代码 | 点击:次
图形检测在计算机视觉开发中是一项非常重要的操作,算法通过对图像的检测,分析出图像中可能存在哪些形状。除此之外,除了让计算机识别轮廓之外,轮廓也需要让人看到,这就需要再分别读这些轮廓的形状进行描绘。
cv2.findContours() & cv2.drawContours() 方法
在Python中OpenCV提供了findContours() 方法来判断图像的轮廓,drawContours()方法来绘制轮廓。
cv2.findComtours()方法的语法如下
cv2.contours, hierarchy = findContours(image, mode, method)
其中
contours是一个列表,列表的每一个元素都是由某个轮廓的像素的坐标组成的数组。
hierarchy是轮廓与轮廓之间的层次关系。
mode取值表
mode值 | 描述 |
---|---|
cv2.RETR_EXTERNAL | 只检测外轮廓 |
cv2.RETR_LIST | 检测所有轮廓,但不建立层次关系 |
cv2.RETR_CCOMP | 检测所有轮廓,并建立两级层次关系 |
cv2.RETR_TREE | 建立所有轮廓,并建立树状结构的层次关系 |
method取值表
cv2.PATH_APPROX_ | 储存轮廓上所有点 |
---|---|
cv2.PATH_APPROX_NONE | 只保存水平、垂直或对角线轮廓的端点 |
cv2.PATH_APPROX_SIMPLE | Ten-Chinl |
cv2.PATH_APPROX_TC89_L1 | Ten-Chinl近似算法的一种 |
cv2.PATH_APPROX_TC89_KCOS | Ten-Chinl近似算法的一种 |
cv2.drawContours(image, contours, contourIdx, color, thickness=None, lineType=None, hierarchy=None, maxLevel=None, offset=None)
drawContours() 方法返回的是一个图像(数组)。
以队此小鸟图操作为例(test1.jpg):
import cv2 img = cv2.imread("test1.jpg") # 彩色图像转为变成单通道灰度图像 gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) # 二值化处理 t, binary = cv2.threshold(gray, 127, 255, cv2.THRESH_BINARY) # 检测图像中出现的所有轮廓,记录轮廓的每一个点 contours, hierarchy = cv2.findContours(binary, cv2.RETR_LIST, cv2.CHAIN_APPROX_NONE) # 绘制所有轮廓,宽度为5,颜色为红色 cv2.drawContours(img, contours, -1, (0, 0, 255), 5) cv2.imshow("img", img) cv2.waitKey() cv2.destroyAllWindows()
程序执行结果展示如下,图中所有能够识别出的轮廓被描出:
轮廓拟合,即,将凹凸不平的轮廓用平整的几何图形体现出来。这里展示使用矩形和圆形拟合两种方法。
在Python中OpenCV提供了cv2.boundingRect()来计算轮廓的最小矩形边界的坐标 ,其语法如下
retval = cv2.boundingRect(array)
其中参数array为轮廓数组。即,cv2.findComtours()方法的执行结果中的contours中的元素。
返回值retval是一个包含着四个整数值的元组,四个值依次是左上角顶点的横坐标,左上角顶点的纵坐标,矩形的宽,矩形的高。
常常也可以写成x,y,w,h = retval = cv2.boundingRect(array)
还以这张小鸟图片(test1.jpg)为例,在上一个部分的示例中,我们找出并绘制出了图中所有的轮廓,经过调试,发现被识别出的轮廓共有94个。
我们要从数组列表中,选择出表示小鸟轮廓的位置的数组。
从上图中可以看出,小鸟的轮廓是所有轮廓中最大的。即该数组的 shape[0] 最大。即我们只用找出 shape[0]最大的即可。
import cv2 img = cv2.imread("test1.jpg") # 从彩色图像变成单通道灰度图像 gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) # 将灰度图像进行二值化阈值处理 t, binary = cv2.threshold(gray, 127, 255, cv2.THRESH_BINARY) # 获取二值化图像中的轮廓极轮廓层次数据 contours, hierarchy = cv2.findContours(binary, cv2.RETR_LIST, cv2.CHAIN_APPROX_SIMPLE) # 找出小鸟的轮廓 n1 = 1 n2 = 0 index = 0 for arr in contours: if len(arr) > n1: n1 = len(arr) index = n2 n2 += 1 print(index) x, y, w, h = cv2.boundingRect(contours[index]) # 绘制红色矩形 cv2.rectangle(img, (x, y), (x + w, y + h), (0, 0, 255), 2) cv2.imshow("img", img) cv2.waitKey() cv2.destroyAllWindows()
绘制出矩形包围框效果如下:
在Python中OpenCV提供了cv2.minEnclosingCircle()来计算轮廓的最小圆形边界的圆心和半径 ,其语法如下
center,radius = minEnclosingCircle(points)
其中
同样的算法,只是这次调用cv2.minEnclosingCircle()方法,其他不变:
import cv2 img = cv2.imread("test1.jpg") # 读取原图 gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) # 从彩色图像变成单通道灰度图像 # 将灰度图像进行二值化阈值处理 t, binary = cv2.threshold(gray, 127, 255, cv2.THRESH_BINARY) # 获取二值化图像中的轮廓极轮廓层次数据 contours, hierarchy = cv2.findContours(binary, cv2.RETR_LIST, cv2.CHAIN_APPROX_SIMPLE) n1 = 1 n2 = 0 index = 0 for arr in contours: if len(arr) > n1: n1 = len(arr) index = n2 n2 += 1 center, radius = cv2.minEnclosingCircle(contours[index]) # 圆心点横坐标转为近似整数 x = int(round(center[0])) # 圆心点纵坐标转为近似整数 y = int(round(center[1])) cv2.circle(img, (x, y), int(radius), (0, 0, 255), 2) cv2.imshow("img", img) cv2.waitKey() cv2.destroyAllWindows()
绘制出圆形包围框效果如下(因为尺寸问题,只画出了一部分):
使用矩形框和圆形框对图形的贴合程度往往都会较差。为了提高这个贴合程度,我们可以使用“凸包”。
所谓凸包,就是最逼近轮廓的多边形。
在Python中OpenCV提供了 cv2.bonvexHull()方法来计算凸包
cv2.bonvexHull()方法语法如下:
hull = convexHull(points, clockwise=None, returnPoints=None)
其中
返回值hull是凸包的点阵数组
依然以“test1.jpg为例”,为图中的小鸟绘制凸包:
import cv2 img = cv2.imread("test1.jpg") # 转为灰度图像 gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) # 二值化阈值处理 ret, binary = cv2.threshold(gray, 127, 225, cv2.THRESH_BINARY) # 检测图像中出现的所有轮廓 contours, hierarchy = cv2.findContours(binary, cv2.RETR_LIST, cv2.CHAIN_APPROX_SIMPLE) n1 = 1 n2 = 0 index = 0 for arr in contours: if len(arr) > n1: n1 = len(arr) index = n2 n2 += 1 hull = cv2.convexHull(contours[index]) cv2.polylines(img, [hull], True, (0, 0, 255), 2) cv2.imshow("img", img) cv2.waitKey() cv2.destroyAllWindows()
Canny边缘检测算法是John F.Canny在1986年开发的一个多级边缘检测算法。
Canny边缘检测算法通过像素的梯度变化寻找图像的边缘,最终可以绘制出十分精细的二值边缘图像
edges = cv2.Canny(image, threshold1, threshold2, apertureSize=None, L2gradient=None)
其中
关于这两个阈值怎么用,这涉及到了算法的底层逻辑,还请自行探索。这里一种可以接受的解释是:低于阈值1的像素点,会被认为不构成边缘,而高于阈值2的像素点,会被认为构成边缘。
最后返回值edges是一个二值的灰度图像。
下边对test1.jpg以三组不同的阈值来做Canny边缘检测,根据处理结果感受算法效果:
- 当阈值为 10-50 时
import cv2 img = cv2.imread("test1.jpg") r1 = cv2.Canny(img, 10, 50) cv2.imshow("r1", r1) cv2.waitKey() cv2.destroyAllWindows()
- 当阈值为100-200时
import cv2 img = cv2.imread("test1.jpg") r2 = cv2.Canny(img, 100, 200) cv2.imshow("r2", r2) cv2.waitKey() cv2.destroyAllWindows()
- 当阈值为400-600时
import cv2 img = cv2.imread("test1.jpg") r3 = cv2.Canny(img, 400, 600) cv2.imshow("r3", r3) cv2.waitKey() cv2.destroyAllWindows()
霍夫变换是一种特征检测,通过霍夫变换可以检测出图像中存在的特殊的形状。比如,直线,圆等。
霍夫变换检测直线时,算法有两个,
一个是cv2.HoughLines() 方法,用于检测无限延长的直线;
另一个是cv2.HoughLinesP() 方法,用于检测线段。
霍夫变换检测圆,使用的是**cv2.HoughCircles()**方法。
使用这三个方法前,都要先对图像进行降噪处理(使用滤波器),以去除干扰。
cv2.HoughLines()语法如下:
lines = cv.HoughLines( image, rho, theta, threshold[,srn][,stn])
其中
返回值lines,是一个数组,shape为(n, 1, 2),n表示检测出的所有线段数目,每个线段用极坐标(ρ, θ)表示。
以此跨海大桥图(test2.jpg)为例,对其使用cv2.HoughLines()方法,并绘制直线:
import cv2 import numpy as np img = cv2.imread("test2.jpg") o = img.copy() # 使用中值滤波进行降噪 o = cv2.medianBlur(o, 5) # 从彩色图像变成单通道灰度图像 gray = cv2.cvtColor(o, cv2.COLOR_BGR2GRAY) # 绘制边缘图像 binary = cv2.Canny(o, 50, 150) # 检测直线 不限步长,不限角度,至少50个点确定一条线 lines = cv2.HoughLines(binary, 1, np.pi / 180, 50) # print(lines) # print(lines.shape) for line in lines: rho, theta = line[0] a = np.cos(theta) b = np.sin(theta) x0 = a * rho y0 = b * rho x1 = int(x0 + 1000 * (-b)) y1 = int(y0 + 1000 * (a)) x2 = int(x0 - 1000 * (-b)) y2 = int(y0 - 1000 * (a)) cv2.line(img, (x1, y1), (x2, y2), (0, 0, 255), 2) cv2.imshow("img", img) cv2.waitKey() cv2.destroyAllWindows()
识别效果如下,可以自行调节参数进行改良,并在这个过程中具体感受每个参数的作用。
当选择至少50个点确定一条线时,一共检测出168根直线:
当选择至少100个点确定一条线时,一共检测出35根直线:
当选择至少300个点确定一条直线时,符合要求的直线有3根:
当选择至少380个点确定一条直线时,这样的直线还剩一根:
相比检测直线,检测线段的cv2.HoughLinesP()相对要更常用些。
lines = cv2.HoughLinesP(image, rho, theta, threshold, minLineLength=None, maxLineGap=None)
检测线段
返回值lines,是一个数组,shape为(n, 1, 4),n表示检测出的所有线段数目,4指的是每个线段的两端端点的笛卡尔坐标(x, y) 坐标的四个点。
其中minLineLength(最小线段长度)和maxLineGap(最小线段距离)两个参数,都是越大,识别的线段越少。
import cv2 import numpy as np img = cv2.imread("test2.jpg") o = img.copy() # 使用中值滤波进行降噪 o = cv2.medianBlur(o, 5) # 从彩色图像变成单通道灰度图像 gray = cv2.cvtColor(o, cv2.COLOR_BGR2GRAY) # 绘制边缘图像 binary = cv2.Canny(o, 50, 150) # 检测线段,不限步长,不限角度,至少100个点确定一条线。最大将距离为200的线段连城一条线。 lines = cv2.HoughLinesP(binary, 1, np.pi / 180, 50, minLineLength=100, maxLineGap=200) print(lines.shape) for line in lines: x1, y1, x2, y2 = line[0] cv2.line(img, (x1, y1), (x2, y2), (0, 0, 255), 2) cv2.imshow("canny", binary) cv2.imshow("img", img) cv2.waitKey() cv2.destroyAllWindows()
二值化边缘图案效果:
描绘线段效果(minLineLength=100)至少100个点确定一条线段(上边代码),最大将距离为200的线段连接起来
共描绘了23条线:
描绘线段效果(minLineLength=500)至少500个点确定一条线段,最大将距离为200的线段连接起来
共描绘了6条线段:
描绘线段效果(minLineLength=720)至少720个点确定一条线段,最大将距离为200的线段连接起来
共描绘了一条线:
circles = HoughCircles(image, method, dp, minDist, circles=None, param1=None, param2=None, minRadius=None, maxRadius=None)
其中
返回值circles是一个数组,数组内是所有检测出的圆环,shape为(n,1,3)。其中3表示圆心的x坐标,圆心的y坐标和半径长度三个指标。
了解完语法,
接下来我们来检测下图(test3.jpg)中的客家土楼中的圆形。
import cv2 import numpy as np img = cv2.imread("test3.jpg") # 使用中值滤波进行降噪 o = cv2.medianBlur(img, 11) # 从彩色图像变成单通道灰度图像 gray = cv2.cvtColor(o, cv2.COLOR_BGR2GRAY) # 展示灰度图像 cv2.imshow('gray', gray) # 检测圆环,圆心最小间距为50,Canny最大阈值为40,投票数超过63。最小半径为10,最大半径为50 circles = cv2.HoughCircles(gray, cv2.HOUGH_GRADIENT, 1, 50, param1=40, param2=63, minRadius=10, maxRadius=100) # 将数组元素四舍五入成整数 circles = np.uint(np.around(circles)) # 遍历圆环结果 for c in circles[0]: # 圆心横坐标、纵坐标和圆半径 x, y, r = c # 绘制圆环 cv2.circle(img, (x, y), r, (0, 0, 255), 3) # 绘制圆心 cv2.circle(img, (x, y), 2, (0, 0, 255), 3) cv2.imshow("img", img) cv2.waitKey() cv2.destroyAllWindows()
降过噪的灰度图像如下:
识别结果呈现如下,如图成功识别出了图中所有土楼的圆形: