数字图像处理(二) 数字图像处理基础

本节主要目的是介绍本书所用到的数字图像处理的一些基本概念。来源于东北大学魏颖教授的数字图像课程笔记。

图像的数字化

上一节中获取图像的方式有很多种，大部分是从感知数据生成数字图像。多数传感器的输出是连续的电压波形，我们需要把连续的感知数据转换为数字形式。这种转换包括两种处理：取样和量化。

设连续图像 $f(x, y)$ 经数字化后，可以用一个离散量组成的矩阵 $f(i, j)$ (即二维数组)来表示。为了计算机处理，图像函数 $f(x, y)$ 在空间和取值上必须数字化
$f(x, y)=\left[\begin{array}{cccc}{f(0,0)} & {f(0,1)} & {\dots} & {f(0, N-1)} \\ {f(1,0)} & {f(1,1)} & {\dots} & {f(1, N-1)} \\ {\vdots} & {\vdots} & {} & {\vdots} \\ {f(M-1,0)} & {f(M-1,1)} & {\dots} & {f(M-1, N-1)}\end{array}\right]$
该式的两边以等效的方式定量的表示了一副数字图像，右边是一个实数矩阵，该矩阵中的每个元素称为图像单元、图像元素或像素。数字图像的原点位于左上角，其中正 $x$ 轴向下延伸，正 $y$ 轴向右延伸。

1. 矩阵中的每一个元素称为一个像素； $g (i, j)$ 代表 $(i, j)$ 点的灰度值，即亮度值。

2. 用 $g(i,j)$ 的数值来表示 $(i,j)$ 位置点上灰度级值的大小，即只反映了黑白灰度的关系。

3. 如果是一幅彩色图像，各点的数值还应当反映色彩的变化，可用 $g(i,j, λ)$ 表示，其中λ是波长。

4. 如果图像是运动的，还应是时间 $t$ 的函数，即可表示为 $g(i,j,\lambda,f)$ 。

将坐标值数字化称为采样;将振幅数字化称为量化。

图像的采样：

空间坐标 $(x,y)$ 的数字化被称为图像采样,确定水平和垂直方向上的像素个数 $N$ 、 $M$ 。

在这里插入图片描述

采样：图像在空间上的离散化称为采样。也就是用空间上部分点的灰度值代表图像，这些点称为采样点。由于图像是一种二维分布的信息，为了对它进行采样操作，需要先将二维信号变为一维信号，再对一维信号完成采样。具体做法是，先沿垂直方向按一定间隔从上到下顺序地沿水平方向直线扫描，取出各水平线上灰度值的一维扫描。而后再对一维扫描线信号按一定间隔采样得到离散信号，即先沿垂直方向采样，再沿水平方向采样这两个步骤完成采样操作。对于运动图像（即时间域上的连续图像），需先在时间轴上采样，再沿垂直方向采样，最后沿水平方向采样由这三个步骤完成。

在进行采样时，采样点间隔的选取是一个非常重要的问题，它决定了采样后图像的质量，即忠实于原图像的程度。采样间隔的大小选取要依据原图像中包含的细微浓淡变化来决定。一般，图像中细节越多，采样间隔应越小。

根据一维采样定理，若一维信号 $g(t)$ 的最大频率为 $ω$ ，以 $T≤1/2ω$ 为间隔进行采样，则能够根据采样结果 $g(iT) (i=…, -1, 0, 1， …)$ 完全恢复 $g(t)$ 。

与采样相关的分辨率的概念:

分辨率：1. 是指映射到图像平面上的单个像素的景物元素的尺寸。单位：像素/英寸，像素/厘米；2. 或者是指要精确测量和再现一定尺寸的图像所必需的像素个数。单位：像素*像素

image

采样处理：将 $xy$ 平面分配到一个网格上，且每一个网格中心的坐标是一个笛卡儿乘积 $Z \times Z$ 的元素对，即所有有序元素对 $(a,b)$ 的集合，其中 $a$ 和 $b$ 属于整数集合 $Z$ 。

在这里插入图片描述

图像的量化

取值的数字化被称为图像灰度级量化，所谓的量化处理，就是将 $f$ 映射到 $Z$ 的处理。 $Z$ 的最大取值，确定像素的灰度级数 $G=2^{m}$ ，如256。

image

模拟图像经过采样后，在时间和空间上离散化为像素。但采样所得的像素值（即灰度值）仍是连续量。把采样后所得的各像素的灰度值从模拟量到离散量的转换称为图像灰度的量化。

若连续灰度值用 $z$ 来表示，对于满足 $z_{i}≤z≤z_{i+1}$ 的 $z$ 值，都量化为整数 $q_{i}$ 。 $q_{i}$ 称为像素的灰度值， $z$ 与 $q_{i}$ 的差称为量化误差。一般，像素值量化后用一个字节8 bit 来表示。

如下图所示，把由黑—灰—白的连续变化的灰度值，量化为0～255共256级灰度值，灰度值的范围为0～255，表示亮度从深到浅，对应图像中的颜色为从黑到白。

image

量化的方法有两种：一是等间隔量化，一是非等间隔量化。

等间隔量化就是简单地把采样值的灰度范围等间隔地分割并进行量化。对于像素灰度值在黑—白范围较均匀分布的图像，这种量化方法可以得到较小的量化误差。该方法也称为均匀量化或线性量化。

非均匀量化是依据一幅图像具体的灰度值分布的概率密度函数，按总的量化误差最小的原则来进行量化。具体做法是对图像中像素灰度值频繁出现的灰度值范围，量化间隔取小一些，而对那些像素灰度值极少出现的范围，则量化间隔取大一些。

由于图像灰度值的概率分布密度函数因图像不同而异，所以不可能找到一个适用于各种不同图像的最佳非等间隔量化方案。因此，实用上一般都采用等间隔量化。

image

一幅图像在采样时，行、列的采样点与量化时每个像素量化的级数，既影响数字图像的质量，也影响到该数字图像数据量的大小。

假定图像取 $M \times N$ 个样点，每个像素量化后的灰度二进制位数为 $Q$ ，一般 $Q$ 总是取为2的整数幂，即 $Q=2k$ , 则存储一幅数字图像所需的二进制位数 $b$ 为:
$b = M \times N \times Q$
字节数 $B$ 为：
$B = M \times N \times \frac{Q}{8} \ (Byte)$
一幅图像的坐标张成的实平面部分称为空间域， $x$ 和 $y$ 称为空间变量或空间坐标。两个坐标轴决定空间位置，第三个坐标是以两个空间变量 $x$ 和 $y$ 为函数的 $f$ (灰度)值。出于存储和量化硬件的考虑，灰度级数 $L$ 典型地取为2的整数次幂，即 $L=2^{k}$ 。

存储数字图像所需的比特数 $b$ 为： $b=M \times N \times k$ 。通常灰度级为 $2^{k}$ 的图像我们称为“ $k$ 比特图像”！

有时，由灰度跨越的值域非正式地称为动态范围，定义为系统中最大可度量灰度与最小可检测灰度之比。作为一条规则，上限取决于饱和度，下限取决于噪声。与这一概念紧密联系的另一概念是图像对比度，定义为：一幅图像中最高和最低灰度级间的灰度差。

对一幅图像，当量化级数 $Q$ 一定时，采样点数 $M \times N$ 对图像质量有着显著的影响。采样点数越多，图像质量越好；当采样点数减少时，图上的块状效应就逐渐明显。

当图像的采样点数一定时，采用不同量化级数的图像质量也不一样。如图所示，量化级数越多，图像质量越好，当量化级数越少时，图像质量越差，量化级数最小的极端情况就是二值图像，图像出现假轮廓。

image

当限定数字图像的大小时, 为了得到质量较好的图像可采用如下原则：

对缓变的图像，应该细量化，粗采样，以避免假轮廓。
对细节丰富的图像，应细采样，粗量化，以避免模糊（混叠）。

对于彩色图像，是按照颜色成分——红（R）、绿（G）、蓝（B）分别采样和量化的。若各种颜色成分均按8 bit量化，即每种颜色量级别是256，则可以处理256×256×256=16 777 216种颜色。

图像数字化设备

将模拟图像数字化成为数字图像，需要某种图像数字化设备。常见的数字化设备有数字相机、扫描仪、数字化仪等。

图像数字化设备的性能主要有像素大小、图像大小、线性度、噪声等。

图像的表示

静态图像可分为矢量(Vector)图和位图（Bitmap），位图也称为栅格图像。

矢量图：是用一系列绘图指令来表示一幅图，如AutoCAD中的绘图语句。这种方法的本质是用数学(更准确地说是几何学)公式描述一幅图像。图像中每一个形状都是一个完整的公式，称为一个对象。对象是一个封闭的整体，所以定义图像上对象的变化和对象与其他对象的关系对计算机来说是简单的，所有这些变化都不会影响到图像中的其他对象。

位图是通过许多像素点表示一幅图像，每个像素具有颜色属性和位置属性。位图可以从传统的相片、幻灯片上制作出来或使用数字相机得到，也可以利用Windows的画笔(Painbrush)用颜色点填充网格单元来创建位图。位图又可以分成如下四种：二值图像 ( 线画稿 LineArt) 、灰度图像(GrayScale)、索引颜色图像(Index Color)和真彩色图像（True Color）。

线画稿－二值图像（黑白图像）：图像的每个像素只能是黑或者白，没有中间的过渡，故又称为２值图像。2值图像的像素值为0、1。

image

灰度图像:

在灰度图像中，像素灰度级用8 bit表示，所以每个像素都是介于黑色和白色之间的 $256（2^{8}=256）$ 种灰度中的一种。灰度图像是指每个像素的信息由一个量化的灰度级来描述的图像，没有彩色信息。

image

索引图像:

颜色深度为每像素24位的数字图像是目前所能获取、浏览和保存的颜色信息最丰富的彩色图像，由于它所表达的颜色远远超出了人眼所能辨别的范围，故将其称为“真彩色”。

在真彩色出现之前，由于技术上的原因，计算机在处理时并没有达到每像素24位的真彩色水平，为此人们创造了索引颜色。

索引颜色通常也称为映射颜色，在这种模式下，颜色都是预先定义的，并且可供选用的一组颜色也很有限，索引颜色的图像最多只能显示256种颜色。一幅索引颜色图像在图像文件里定义，当打开该文件时，构成该图像具体颜色的索引值就被读入程序里，然后根据索引值找到最终的颜色。

真色彩图像：

“真彩色”是RGB颜色的另一种流行的叫法。RGB图像的颜色是非映射的，它可以从系统的“颜色表”里自由获取所需的颜色，这种图像文件里的颜色直接与PC机上的显示颜色相对应。

在真彩色图像中，每一个像素由红、绿和蓝三个字节组成，每个字节为8bit，表示0到255之间的不同的亮度值，这三个字节组合可以产生1670万种不同的颜色。

image

图像文件的格式：

数字图像有多种存储格式，每种格式一般由不同的开发商支持。随着信息技术的发展和图像应用领域的不断拓宽，还会出现新的图像格式。

图像文件的数据构成：每一种图像文件均有一个文件头，在文件头之后才是图像数据。

文件头的内容由制作该图像文件的公司决定，一般包括文件类型、文件制作者、制作时间、版本号、文件大小等内容。各种图像文件的制作还涉及到图像文件的压缩方式和存储效率等。

bmp 图像文件的格式：查阅BMP图像文件格式的相关博客，如：http://blog.csdn.net/o_sun_o/article/details/8351037

图像的质量

图像的质量包括：层次、对比度、清晰度

图像的质量：层次

灰度级：表示像素明暗程度的整数量；层次：表示灰度级的数量。图像数据的实际层次越多视觉效果就越好。

image

图像的质量：对比度

对比度是指一幅图像中灰度反差的大小。对比度=最大亮度/最小亮度。

image

图像的质量：清晰度

与清晰度相关的主要因素：亮度、对比度、主题内容的大小、细微层次、颜色饱和度

图像的颜色

图像的颜色：RGB模型

为了科学地定量描述和使用颜色，人们提出了各种颜色模型。目前常用的颜色模型按用途可分为两类，一类面向诸如视频监视器、彩色摄像机或打印机之类的硬件设备。另一类面向以彩色处理为目的的应用，如动画中的彩色图形。面向硬件设备的最常用彩色模型是RGB模型，而面向彩色处理的最常用模型是HSI模型。另外，在印刷工业上和电视信号传输中，经常使用CMYK和YUV色彩系统。

杨赫姆霍尔兹视觉三基色假说: C = R + G + B。视网膜锥体细胞感红、感绿、感蓝色素RGB分别取值0-1或0-255。

图像的颜色：HSI模型

HSI模型是Munseu提出的，它反映了人的视觉系统观察彩色的方式，在艺术上经常使用 HSI 模型。 HSI模型中， H 表示色调 (Hue) ， S 表示 饱和度(Saturation)， I 表示亮度(Intensity，对应成像亮度和图像灰度)。这个模型的建立基于两个重要的事实： ① I分量与图像的彩色信息无关；② H和S分量与人感受颜色的方式是紧密相联的。这些特点使得HSI模型非常适合借助人的视觉系统来感知彩色特性的图像处理算法。

饱和度是指一个颜色的鲜明程度，饱和度越高，颜色越深，如深红，深绿。

亮度是指光波作用于感受器所发生的效应，其大小由物体反射系数来决定，反射系数越大，物体的亮度愈大，反之愈小。

RGB转换到HSI：

对任何3个［0， 1］范围内的R、G、B值，其对应HSI模型中的I、S、H分量的计算公式为
$\begin{array}{l}{I=\frac{1}{3}(R+G+B)} \\ {S=I-\frac{3}{(R+G+B)}[\min (R, G, B)]} \\ {H=\arccos \left\{\frac{[(R-G)+(R-B)] / 2}{\left[(R-G)^{2}+(R-B)(G-B)\right]^{1 / 2}}\right\}}\end{array}$
HSI转换到RGB：

假设S、I的值在［0，1］之间，R、G、B的值也在［0，1］之间，则HSI转换为RGB的公式为(分成3段以利用对称性)

（1）当H在［0°，120°］之间：
$\begin{array}{l}{B=I(1-S)} \\ {R=I\left[1+\frac{S \cos H}{\cos \left(60^{\circ}-H\right)}\right]} \\ {G=3 I-(B+R)}\end{array}$
（2）在GB扇形区域[120°,240°)，转换公式为：
$H = H-120^{o}\\ R = 1(1-s)\\ G = I[1+\frac{ScosH}{cos(60^{o}-H)}]\\ B = 3I-(R+G)$
（3）在BR扇形区域[240°,360°)，转换公式为：
$H-H-240^{o}\\ G = 1(1-s)\\ B = I[1+\frac{ScosH}{cos(60^{o}-H)}]\\ R = 3I-(G+B)$

图像的颜色：CMYK表色系统

CMYK表色系统也是一种常用的表示颜色的方式。计算机屏幕显示通常用RGB表色系统，它是通过相加来产生其他颜色，这种做法通常称为加色合成法(Additive Color Synthesis)。而在印刷工业上则通常用CMYK表色系统，它是通过颜色相减来产生其他颜色的，所以称这种方式为减色合成法(Subtractive Color Synthesis)。

CMYK模式的原色为青色(Cyan)、品红色(Magenta)、黄色(Yellow)和黑色（Black）。在处理图像时，一般不用CMYK模式，主要是因为这种模式的文件大，占用的磁盘空间和内存大。这种模式一般在印刷时使用。

图像的颜色：伪彩色模型

定义：通过颜色映射表描述色彩实际上是RGB颜色模型的变体

用伪彩色描述颜色的方法：建立颜色映射表一般表的长度16-256；像素值用其RGB值在映射表中的位置代替；通过抖动技术缓解颜色种类不足的问题；如何找出16-256种关键颜色是成败的关键。

图像的颜色：其它表色系（YUV电视信号彩色坐标系统)

YUV彩色电视信号传输时，将R、G、B改组成亮度信号和色度信号。PAL制式将R、G、B三色信号改组成Y、U、V信号，其中Y信号表示亮度，U、V信号是色差信号。

RGB与YUV之间的对应关系如下：
$\left[\begin{array}{l}{Y} \\ {U} \\ {V}\end{array}\right]=\left[\begin{array}{ccc}{0.299} & {0.587} & {0.114} \\ {-0.148} & {-0.289} & {-0.437} \\ {0.615} & {0.515} & {-0.100}\end{array}\right] \cdot\left[\begin{array}{l}{R} \\ {G} \\ {B}\end{array}\right]\\ \left[\begin{array}{l}{R} \\ {G} \\ {B}\end{array}\right]=\left[\begin{array}{ccc}{1} & {0} & {1.140} \\ {1} & {-0.395} & {-0.581} \\ {1} & {2.032} & {0}\end{array}\right] \cdot\left[\begin{array}{l}{Y} \\ {U} \\ {V}\end{array}\right]$

图像的像素

相邻像素：

位于坐标( $x$ , $y$ )处的像素 $p$ 有4个水平和垂直的相邻像素，其坐标由下式给出：
$(x+1,y),(x-1,y),(x,y+1),(x,y-1)$
这组像素称为 $p$ 的4领域，用 $N_{4}(p)$ 表示。

$p$ 的4个对角相邻像素的坐标如下：
$(x+1,y+1),(x+1,y-1),(x-1,y+1),(x-1,y-1)$
并用 $N_{D}(p)$ 表示。这些点与4领域点一起称为p的8领域，用 $N_{8}(p)$ 表示。即 $N_{4}(p)+N_{D}(p)=N_{8}(p)$ 。

image

图像的连通性：4－连通、8－连通、m－连通

两个像素连通的两个必要条件是：两个像素的位置在某种情况下是否相邻；两个像素的值是否满足某种相似性。

4-连通的定义：

对于具有值V的像素p和q，如果q在集合N4(p)中，则称这两个像素是4-连通的

image

8-连通的定义：对于具有值V的像素p和q，如果q在集合N8(p)中则称这两个像素是8-
连通的

image

图像的连通性：像素邻近、图像子图临近

像素临近的定义：

如果像素p和q是连通的，则称p临近于q。我们可以用定义邻域的方法定义4-临近、8-临近和m-临近
图像子图临近的定义：

如果两个图像子集S1和S2中的某些像素是临近的，则称S1和S2是临近的

image

图像的连通性：路径

路径的定义：

一条从具有坐标 $(x,y)$ 的像素 $p$ ,到具有坐标 $(s,t)$ 的像素 $q$ 的路径，是具有坐标 $(x_{0},y_{0})$ , $(x_{1},y_{1})$ ,..., $(x_{n},y_{n})$ 的不同像素的序列，其中 $(x_{0},y_{0})$ = $(x,y)$ ， $(x_{n},y_{n})$ = $(s,t)$ ， $(x_{i},y_{i})$ 临近于 $(x_{i-1},y_{i-1})$ $1≤i≤n$ ， $n$ 是路径的长度。

我们可以用定义临近的方法定义4-路径8-路径和m-路径

图像的连通性：4－路径、8－路径、m－路径

image

图像的连通性：

像素在图像子集中连通的定义:

如果像素 $p$ 和 $q$ 是图像子集 $S$ 中的元素，如果存在一条完全由 $S$ 中的像素组成的从 $p$ 到 $q$ 的路径，则称 $p$ 和 $q$ 在 $S$ 中是连通的。

图像子集连通元素的定义：

对于 $S$ 中的任意像素 $p$ , $S$ 中连接到 $p$ 的所有像素的集合被称为 $S$ 的连通元素。

image

图像的距离：

像素之间距离函数的定义：

对于像素p， q和z 分别具有坐标(x ,y) (s,t) (u ,v) ，D是距离函数或称度量，当

(a) D(p,q) ≥0 (D(p,q) = 0 仅当p = q),

(b) D(p,q) = D(q,p) 并且

像素之间距离函数的定义：

(a) D(p,q) ≥0 两点之间距离大于等于0

(b) D(p,q) = D(q,p) 距离与方向无关

图像的距离：欧几里德距离（De距离）:
$De(p,q) = [(x－ s) 2 + (y － t) 2] ^{\frac{1}{2}}$
对于这个距离计算法，具有与(x,y)距离小于等于某个值r的那些像素是包含在以(x,y)为圆心、以r为半径的圆环中的那些点。

图像的距离： D4距离（城市距离）:

p和q之间的D4距离定义为:
$D4(p,q) = |x－ s| + |y－ t|$
具有与(x,y)距离小于等于某个值r 的那些像素形成一个菱形。例如，与点(x,y) （中心点）D4距离小于等于2的像素，形成下列常数距离的轮廓。具有D4 = 1的像素是(x,y)的4-邻域。

image

图像的距离： D8距离（棋盘距离）:

p和q之间的D8距离定义为
$D8(p,q) = max(|x － s| ,|y － t|)$
具有D8 = 1的像素是(x,y)的8-邻域距离小于r的像素围城一个矩形。

图像的基本系统

基本图像处理系统的结构

image

图像的输入：图像输入设备

基于CCD光电耦器件的输入设备有：摄像机、数字摄像机、数字相机、平板扫描仪。

基于光电倍增管的输入设备有：滚筒扫描仪。

扫描仪分辨率与扫描图像的大小：分辨率：单位长度上采样的像素个数：DPI(dot/inch)。

图像的存储

图像文件格式体系：互联网用：GIF、JPG、PNG；印刷用：TIF、JPG、TAG 、PCX；国际标准：TIF、JPG

图像存储体系：内存存储：处理时使用； 硬盘存储：处理、备份时用（在线）；备份存储：光盘、磁带（离线、近线）；分级存储（HSM），网络存储（SAN/NAS)。

图像的直方图、卷积与滤波

直方图的基本概念：

将图像中像素亮度（灰度级别）看成是一个随机变量，则其分布情况反映了图像的统计特性，这可用Probability Density Function (PDF)来刻画和描述，表现为灰度直方图（Histogram）。

灰度直方图是灰度级的函数，表示图像中具有某种灰度级的像素的个数，反映了图像中每种灰度出现的频率。

灰度直方图的横坐标是灰度级，纵坐标是该灰度级出现的频度，它是图像最基本的统计特征。

图像直方图的定义举例:

image

直方图的性质：

（1）直方图只包含了该图像中某一灰度值的像素出现的概率，丢失了其所在位置的信息。

（2）任一幅图像，都能惟一地确定出一幅与它对应的直方图，但不同的图像，可能有相同的直方图。如图两幅不同图像具有相同直方图。

卷积与滤波：

图像处理的方法基本上可分为空间域法和频域法两大类。

（1）空间域法：

在原图像上直接进行数据运算，对像素的灰度值进行处理。它又分为两类：点运算和局部运算。所谓的点运算就是：对图像作逐点运算；局部运算是：在与处理像点邻域有关的空间域上进行运算。

（2）频域法：

在图像的变换域上进行处理，增强感兴趣的频率分量，然后进行反变换，得到频域处理过的图像。

空域滤波及滤波器的定义：

使用空域模板进行的图像处理，被称为空域滤波（局部运算）。模板本身被称为空域滤波器。

空间域滤波：卷积与模板：

模板操作是数字图像处理中常用的一种运算方式，图像的平滑、锐化、细化、边缘检测等都要用到模板操作。例如，有一种常见的平滑算法是将原图中的一个像素的灰度值和它周围邻近8个像素的灰度值相加，然后将求得的平均值作为新图像中该像素的灰度值。可用如下方法来表示该操作：

image

上式有点类似于矩阵，通常称之为模板（Template），带星号的数据表示该元素为中心元素，即这个元素是将要处理的元素。

如果模板为：

image

则该操作的含义是：将原图中一个像素的灰度值和它右下相邻近的8个像素值相加，然后将求得的平均值作为新图像中该像素的灰度值。

模板操作实现了一种邻域运算，即某个像素点的结果不仅和本像素灰度有关，而且和其邻域点的值有关。模板运算的数学含义是卷积（或互相关）运算。

卷积与滤波：

卷积是一种用途很广的算法，可用卷积来完成各种空域的图像处理：

image

卷积运算中的卷积核就是模板运算中的模板：

卷积就是作加权求和的过程。邻域中的每个像素（假定邻域为3×3大小，卷积核大小与邻域相同），分别与卷积核中的每一个元素相乘，乘积求和所得结果即为中心像素的新值。

卷积核中的元素称作加权系数（亦称为卷积系数），卷积核中的系数大小及排列顺序，决定了对图像进行区处理的类型。改变卷积核中的加权系数，会影响到总和的数值与符号，从而影响到所求像素的新值。

<center>卷积核＝模板＝空域滤波器</center>

模板或卷积的加权运算中，存在一些具体问题：

图像边界问题，当在图像上移动模板（卷积核）至图像的边界时，在原图像中找不到与卷积核中的加权系数相对应的9个像素，即卷积核悬挂在图像缓冲区的边界上，这种现像在图像的上下左右四个边界上均会出现。

解决这个问题采用两种简单方法：一种方法是忽略图像边界数据，另一种方法是在图像四周复制原图像边界像素的值，从而使卷积核悬挂在图像四周时可以进行正常的计算。

计算出来的像素值的动态范围问题：对此可简单地将其值置为0或255即可。

空域图像的运算

加法运算的定义：

$C(x,y) = A(x,y) + B(x,y)$

主要应用举例：去除“叠加性”噪声。生成图像叠加效果

去除“叠加性”噪声：

对于原图像f(x,y),有一个噪声图像集 ${ g_{i}(x,y)} \ i =1,2,...M$ 其中： $g_{i}(x,y) = f(x,y) + h(x,y)_{i}$ M个图像的均值定义为： $g(x,y) = 1/M (g_{0}(x,y)+g_{1}(x,y)+…+ g_{M}(x,y))$ 当：噪声 $h(x,y)_{i}$ 为互不相关，且均值为0时，上述图像均值将降低噪声的影响。

生成图像叠加效果：

对于两个图像 $f(x,y)$ 和 $h(x,y)$ 有： $g(x,y) = 1/2f(x,y) + 1/2h(x,y)$ 会得到二次暴光的效果。推广这个公式为： $g(x,y) = αf(x,y) + βh(x,y)$ 其中 $α+β= 1$ 。

我们可以得到各种图像合成的效果，也可以用于两张图片的衔接。

image

减法的定义：

$C(x,y) = A(x,y) - B(x,y)$

主要应用举例：

去除不需要的叠加性图案；检测同一场景两幅图像之间的变化；计算物体边界的梯度。

a. 去除不需要的叠加性图案:

设：背景图像b(x,y)，前景背景混合图像f(x,y)：g(x,y) = f(x,y) – b(x,y)。g(x,y) 为去除了背景的图像。电视制作的蓝屏技术就基于此。

b. 检测同一场景两幅图像之间的变化:

设：时间1的图像为 $T1(x,y)$ ，时间2的图像为 $T2(x,y)$ ； $g(x,y) = T2(x,y) - T1(x,y)$ 。

image

c .计算物体边界的梯度：

在一个图像内，寻找边缘时，梯度幅度（描绘变化陡峭程度的量）的近似计算
$|Vf(x,y)| = max(f(x,y)–f(x+1,y) ,f(x,y)–f(x,y+1))$

乘法的定义：

$C(x,y) = A(x,y) * B(x,y)$

主要应用举例：图像的局部显示；用二值蒙板图像与原图像做乘法。

image

逻辑运算：

在“与”和“或”运算中，亮的表示二进制码1，黑的代表0。模板处理有时可以作为一种感兴趣区（ROI）处理。

image

求反运算：

求反的定义 $g(x,y) = 255 - f(x,y)$ 主要应用举例：获得一个阴图像；获得一个子图像的补图像。

image

获得一个子图像的补图像:

image

像素之间的一些基本关系

相邻像素：

邻接性、连通性、区域和边界：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-EbiyDJqb-1573785577086)(C:\Users\MrHo\AppData\Roaming\Typora\typora-user-images\1573373214472.png)]

定义 $V$ 为邻接性的灰度值集合。在二值图像中，我们把具有1值得像素归诸于邻接像素，即 $V$ ={1}。

4邻接:如果q在集合N4(p)中，则具有V中数值的两个像素p和q是4邻接的。

8邻接:如果q在集合N8(p)中，则具有V中数值的两个像素p和q是8邻接的。

m邻接:如果q在N4(p)中，或者在 $N_{D}(p)$ 中，而且集合N4(p)与N4(q)的交集没有V中的像素，此为1，则具有V中数值的两个像素p和q是m邻接的。

我的微信公众号名称：深度学习与先进智能决策
微信公众号ID：MultiAgent1024
公众号介绍：主要研究分享深度学习、机器博弈、强化学习等相关内容！期待您的关注，欢迎一起学习交流进步！

最后编辑于：2020.02.04 15:38:17

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 203,456评论 5赞 477
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,370评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 150,337评论 0赞 337
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,583评论 1赞 273
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,596评论 5赞 365
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,572评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,936评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,595评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,850评论 1赞 297
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,601评论 2赞 321
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,685评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,371评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,951评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,934评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,167评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 43,636评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,411评论 2赞 342

数字图像处理(二) 数字图像处理基础

图像的数字化

图像的表示

图像的质量

图像的颜色

图像的像素

图像的基本系统

图像的直方图、卷积与滤波

空域图像的运算

像素之间的一些基本关系

推荐阅读更多精彩内容