Python 从零到壹丨带你了解图像直方图理论知识和绘制实现
一。图像直方图理论知识
灰度直方图是灰度级的函数,描述的是图像中每种灰度级像素的个数,反映图像中每种灰度出现的频率。假设存在一幅 6×6 像素的图像,接着统计其 1 至 6 灰度级的出现频率,并绘制如图 1 所示的柱状图,其中横坐标表示灰度级,纵坐标表示灰度级出现的频率 [1-2]。
如果灰度级为 0-255(最小值 0 为黑色,最大值 255 为白色),同样可以绘制对应的直方图,如图 2 所示,左边是一幅灰度图像(Lena 灰度图),右边是对应各像素点的灰度级频率。
为了让图像各灰度级的出现频数形成固定标准的形式,可以通过归一化方法对图像直方图进行处理,将待处理的原始图像转换成相应的标准形式 [3]。假设变量 r 表示图像中像素灰度级,归一化处理后会将 r 限定在下述范围:
在灰度级中,r 为 0 时表示黑色,r 为 1 时表示白色。对于一幅给定图像,每个像素值位于 [0,1] 区间之内,接着计算原始图像的灰度分布,用概率密度函数 P® 实现。为了更好地进行数字图像处理,必须引入离散形式。在离散形式下,用 rk 表示离散灰度级,P (rk) 代替 P®,并满足公式(2)。
公式中,nk 为图像中出现 rk 这种灰度的像素数,n 是图像中像素总数,是概率论中的频数,l 是灰度级总数(通常 l 为 256 级灰度)。接着在直角坐标系中做出 rk 和 P (rk) 的关系图,则成为灰度级的直方图 [4]。
假设存在一幅 3×3 像素的图像,其像素值如公式(3)所示,则归一化直方图的步骤如下:
首先统计各灰度级对应的像素个数。用 x 数组统计像素点的灰度级,y 数组统计具有该灰度级的像素个数。其中,灰度为 1 的像素共 3 个,灰度为 2 的像素共 1 个,灰度为 3 的像素共 2 个,灰度为 4 的像素共 1 个,灰度为 5 的像素共 2 个。
接着统计总像素个数,如公式(5)所示。
最后统计各灰度级的出现概率,通过公式(6)进行计算,其结果如下:
绘制的归一化图行如图 3 所示,横坐标表示图像中各个像素点的灰度级,纵坐标表示出现这个灰度级的概率。
直方图被广泛应用于计算机视觉领域,在使用边缘和颜色确定物体边界时,通过直方图能更好地选择边界阈值,进行阈值化处理。同时,直方图对物体与背景有较强对比的景物的分割特别有用,可以应用于检测视频中场景的变换及图像中的兴趣点。
二.OpenCV 绘制直方图
首先讲解使用 OpenCV 库绘制直方图的方法。在 OpenCV 中可以使用 calcHist () 函数计算直方图,计算完成之后采用 OpenCV 中的绘图函数,如绘制矩形的 rectangle () 函数,绘制线段的 line () 函数来完成。其中,cv2.calcHist () 的函数原型及常见六个参数如下:
hist = cv2.calcHist(images, channels, mask, histSize, ranges, accumulate)
hist 表示直方图,返回一个二维数组
images 表示输入的原始图像
channels 表示指定通道,通道编号需要使用中括号,输入图像是灰度图像时,它的值为 [0],彩色图像则为 [0]、[1]、[2],分别表示蓝色(B)、绿色(G)、红色(R)
mask 表示可选的操作掩码。如果要统计整幅图像的直方图,则该值为 None;如果要统计图像的某一部分直方图时,需要掩码来计算
histSize 表示灰度级的个数,需要使用中括号,比如 [256]
ranges 表示像素值范围,比如 [0, 255]
accumulate 表示累计叠加标识,默认为 false,如果被设置为 true,则直方图在开始分配时不会被清零,该参数允许从多个对象中计算单个直方图,或者用于实时更新直方图;多个直方图的累积结果用于对一组图像的直方图计算
接下来的代码是计算图像各灰度级的大小、形状及频数,接着调用 plot () 函数绘制直方图曲线。
# -*- coding: utf-8 -*-# By:Eastmountimport cv2 import numpy as npimport matplotlib.pyplot as pltimport matplotlib#读取图像src = cv2.imread('lena-hd.png')#计算256灰度级的图像直方图hist = cv2.calcHist([src], [0], None, [256], [0,255])#输出直方图大小、形状、数量print(hist.size) print(hist.shape) print(hist)#设置字体matplotlib.rcParams['font.sans-serif']=['SimHei']#显示原始图像和绘制的直方图plt.subplot(121) plt.imshow(src, 'gray') plt.axis('off') plt.title("(a)Lena灰度图像") plt.subplot(122) plt.plot(hist, color='r') plt.xlabel("x") plt.ylabel("y") plt.title("(b)直方图曲线") plt.show()
上述代码绘制的 “Lena” 灰度图像所对应的直方图曲线如图 4 所示,图 4 (a) 表示原图像,图 4 (b) 表示对应的灰度直方图曲线。
同时输出直方图的大小、形状及数量,如下所示:
256(256L, 1L)[[7.000e+00] [1.000e+00] [0.000e+00] [6.000e+00] [2.000e+00] .... [1.000e+00] [3.000e+00] [2.000e+00] [1.000e+00] [0.000e+00]]
彩色图像调用 OpenCV 绘制直方图的算法与灰度图像一样,只是从 B、G、R 三个放量分别进行计算及绘制,具体代码如下所示。
# -*- coding: utf-8 -*-# By:Eastmountimport cv2 import numpy as npimport matplotlib.pyplot as pltimport matplotlib#读取图像src = cv2.imread('lena.png')#转换为RGB图像img_rgb = cv2.cvtColor(src, cv2.COLOR_BGR2RGB)#计算直方图histb = cv2.calcHist([src], [0], None, [256], [0,255]) histg = cv2.calcHist([src], [1], None, [256], [0,255]) histr = cv2.calcHist([src], [2], None, [256], [0,255])#设置字体matplotlib.rcParams['font.sans-serif']=['SimHei']#显示原始图像和绘制的直方图plt.subplot(121) plt.imshow(img_rgb, 'gray') plt.axis('off') plt.title("(a)Lena原始图像") plt.subplot(122) plt.plot(histb, color='b') plt.plot(histg, color='g') plt.plot(histr, color='r') plt.xlabel("x") plt.ylabel("y") plt.title("(b)直方图曲线") plt.show()
最终绘制的 “Lena” 彩色图像及其对应的彩色直方图曲线如图 5 所示,其中图 5 (a) 表示 Lena 原始图像,图 5 (b) 表示对应的彩色直方图曲线。
三.Matplotlib 绘制直方图
Matplotlib 是 Python 强大的数据可视化工具,主要用于绘制各种 2D 图形。本小节 Python 绘制直方图主要调用 matplotlib.pyplot 库中 hist () 函数实现,它会根据数据源和像素级绘制直方图。其函数主要包括五个常用的参数,如下所示:
n, bins, patches = plt.hist(arr, bins=50, normed=1, facecolor=‘green’, alpha=0.75)
arr 表示需要计算直方图的一维数组
bins 表示直方图显示的柱数,可选项,默认值为 10
normed 表示是否将得到的直方图进行向量归一化处理,默认值为 0
facecolor 表示直方图颜色
alpha 表示透明度
n 为返回值,表示直方图向量
bins 为返回值,表示各个 bin 的区间范围
patches 为返回值,表示返回每个 bin 里面包含的数据,是一个列表
图像直方图的 Python 实现代码如下所示,该示例主要是通过 matplotlib.pyplot 库中的 hist () 函数绘制的。注意,读取的 “lena-hd.png” 图像的像素为二维数组,而 hist () 函数的数据源必须是一维数组,通常需要通过函数 ravel () 拉直图像。
# -*- coding: utf-8 -*-# By:Eastmountimport cv2 import numpy as npimport matplotlib.pyplot as plt#读取图像src = cv2.imread('lena-hd.png')#绘制直方图plt.hist(src.ravel(), 256) plt.xlabel("x") plt.ylabel("y") plt.show()#显示原始图像cv2.imshow("src", src) cv2.waitKey(0) cv2.destroyAllWindows()
读取显示的 “lena” 灰度图像如图 6 所示。
最终的灰度直方图如图 7 所示,它将 Lena 图 256 级灰度和各个灰度级的频数绘制出来,其中 x 轴表示图像的 256 级灰度,y 轴表示各个灰度级的频数。
如果调用下列函数,则绘制的直方图是经过标准化处理,并且颜色为绿色、透明度为 0.75 的直方图,如图 8 所示。
plt.hist(src.ravel(), bins=256, density=1, facecolor=‘green’, alpha=0.75)
彩色直方图是高维直方图的特例,它统计彩色图片 RGB 各分量出现的频率,即彩色概率分布信息。彩色图片的直方图和灰度直方图一样,只是分别画出三个通道的直方图,然后再进行叠加,其代码如下所示。Lena 彩色原始图像如图 9 所示。
# -*- coding: utf-8 -*-# By:Eastmountimport cv2 import numpy as npimport matplotlib.pyplot as plt#读取图像src = cv2.imread('Lena.png')#获取BGR三个通道的像素值b, g, r = cv2.split(src)#绘制直方图plt.figure("Lena")#蓝色分量plt.hist(b.ravel(), bins=256, density=1, facecolor='b', edgecolor='b', alpha=0.75)#绿色分量plt.hist(g.ravel(), bins=256, density=1, facecolor='g', edgecolor='g', alpha=0.75)#红色分量plt.hist(r.ravel(), bins=256, density=1, facecolor='r', edgecolor='r', alpha=0.75) plt.xlabel("x") plt.ylabel("y") plt.show()#显示原始图像cv2.imshow("src", src) cv2.waitKey(0) cv2.destroyAllWindows()
绘制的彩色直方图如图 10 所示,包括红色、绿色、蓝色三种对比。
如果希望将三个颜色分量的柱状图分开绘制并进行对比,则使用下面的代码实现,调用 plt.figure (figsize=(8, 6)) 函数绘制窗口,以及 plt.subplot () 函数分别绘制 4 个子图。
# -*- coding: utf-8 -*-# By:Eastmountimport cv2 import numpy as npimport matplotlib.pyplot as pltimport matplotlib#读取图像src = cv2.imread('lena.png')#转换为RGB图像img_rgb = cv2.cvtColor(src, cv2.COLOR_BGR2RGB)#获取BGR三个通道的像素值b, g, r = cv2.split(src) print(r,g,b) plt.figure(figsize=(8, 6))#设置字体matplotlib.rcParams['font.sans-serif']=['SimHei']#原始图像plt.subplot(221) plt.imshow(img_rgb) plt.axis('off') plt.title("(a)原图像")#绘制蓝色分量直方图plt.subplot(222) plt.hist(b.ravel(), bins=256, density=1, facecolor='b', edgecolor='b', alpha=0.75) plt.xlabel("x") plt.ylabel("y") plt.title("(b)蓝色分量直方图")#绘制绿色分量直方图plt.subplot(223) plt.hist(g.ravel(), bins=256, density=1, facecolor='g', edgecolor='g', alpha=0.75) plt.xlabel("x") plt.ylabel("y") plt.title("(c)绿色分量直方图")#绘制红色分量直方图plt.subplot(224) plt.hist(r.ravel(), bins=256, density=1, facecolor='r', edgecolor='r', alpha=0.75) plt.xlabel("x") plt.ylabel("y") plt.title("(d)红色分量直方图") plt.show()
最终输出的图形如图 11 所示,,图 11 (a) 表示原图像,图 11 (b) 表示蓝色分量直方图,图 11© 表示绿色分量直方图,图 11 (d) 表示红色分类直方图。
四。总结
本文主要讲解图像直方图理论知识以及直方图绘制方法,并且包括 Matplotlib 和 OpenCV 两种统计及绘制方法。灰度直方图是灰度级的函数,描述的是图像中每种灰度级像素的个数,反映图像中每种灰度出现的频率。这篇文章的知识点将为后续图像处理和图像运算对比提供支撑。
参考文献:
[1] 冈萨雷斯。数字图像处理(第 3 版)[M]. 北京:电子工业出版社,2013.
[2] 张恒博,欧宗瑛。一种基于色彩和灰度直方图的图像检索方法 [J]. 计算机工程,2004.
[3] Eastmount. [数字图像处理] 四.MFC 对话框绘制灰度直方图 [EB/OL]. (2015-05-31). https://blog.csdn.net/eastmount/article/details/46237463.
[4] 阮秋琦。数字图像处理学(第 3 版)[M]. 北京:电子工业出版社,2008.
[5] Eastmount. [Python 图像处理] 十一。灰度直方图概念及 OpenCV 绘制直方图 [EB/OL]. (2018-11-06). https://blog.csdn.net/Eastmount/article/details/83758402.