让我们首先在生物学背景下简要介绍一下人脑通过神经元交换信息的过程,以此来探讨这个主题。
神经元是负责传递神经冲动的细胞,即负责接收和处理信息。
在神经科学中,一个 生物神经网络 由一系列层层互连的神经元组成,相邻神经元之间的相互作用通过突触发生。 当一个突触特别强或者与相似的突触同步时(输入信号的总和超过某个临界水平),神经元会产生一个 动作电位,通过化学神经递质或电信号向其他神经元传播和传输信息。
反过来,人工神经网络是一种计算技术,它提供了一种数学模型,该模型使用分层结构中互连的节点或神经元,类似于人脑,并通过经验获取知识。
简而言之,人工神经网络是生物大脑功能的抽象,应用最类似于学习、传输信息和解决问题过程的数学模型。
但有哪些 神经网络 卷积?
作为 卷积神经网络, 或者 >乍一看似乎是一个复杂的概念。 对于某些人,尤其是那些更熟悉数学的人来说,理解它们可能是一项相对简单的任务。 然而,对于大多数人来说,就像我开始探索这个领域时的情况一样,将数学运算的抽象应用于人工智能任务,在本例中是用于图像识别和分类的计算机视觉,并不是一件微不足道的任务。
因此,本文的重点在于阐明卷积运算应用于人工神经网络时的情况。 为了实现这一目标,我们将使用实际示例和类比来简化对这一过程的理解。
根据维基百科,“卷积 是一个线性算子,从两个给定的函数得出第三个函数,该算子测量这些函数沿着它们的叠加所隐含的区域的乘积之和,作为它们之间的位移的函数。”
然而,我认为这个提出的概念仍然不是那么清晰。 因此,我们将简要说明每个步骤,最后,我们将回到概念并检查它是否更清晰。
举个例子,人工智能需要识别字母“X”的图像,该图像将使用 9×9 矩阵表示,其中图像的每个像素位于矩阵中的某个位置:
我们还将有另一个图像,我们将其称为过滤器,由 3×3 矩阵表示,旨在检测图像中的特定模式,例如边缘、纹理、形状或其他特征。 这些过滤器是 > 的“神经元”:
看到3×3矩阵表示的滤波器与图像的部分进行比较,这些部分也是与3×3滤波器矩阵大小相同的矩阵,观察图像中以绿色突出显示的部分:
上图显示了“滤波器”矩阵的每个像素或位置与分析图像的“部分”矩阵的相应位置相乘,从而在第三个矩阵中生成该乘法的结果。 通过在整个分析图像上“滑动”来重复此过程,即遍历整个图像提取滤波器大小的矩阵,直到比较图像中的所有像素。
在上面我们可以看到“幻灯片”(红色)从左到右在图像上移动,选择要比较的部分。
在“滑动”整个图像后比较原始图像中的每个滤波器,将生成一个包含结果的新矩阵,即对于应用的每个滤波器,都会生成一个结果矩阵。
乘法的结果生成相加的值,并且在像本例这样的某些方法中,在求和之后取平均值。 由该数学运算得到的单个值包含在与比较部分的中心相对应的像素中。
下图显示了与完整图像进行比较后的过滤器结果,即“滑动”图像的所有部分后的结果:
因此,我们在应用滤波器或处理神经元后得到了结果图像。 但是图像或生成的矩阵意味着什么? 这意味着发现了属于分析图像一部分的图案。 请注意,在下图中,找到的对角线图案类似于要识别的字母“X”的部分:
应用其他过滤器(神经元),重复该过程并找到图像中的其他模式,从而生成我们所说的 特征图。 这些特征图被堆叠到深度 > 层中,这些层结合从先前层提取的信息来执行特定的分类或任务,例如识别图像中的对象:
现在我们已经展示了人工神经网络中发生的卷积的示例,即使我们尚未将卷积运算与示例相关联,让我们更好地理解卷积在所有这一切中的位置。
卷积是卷积神经网络 (>) 的基本组成部分之一,也是一种基本的数学运算,使这些网络能够学习从图像中提取重要特征。
应用于人工神经网络的卷积是一种数学运算,涉及“在输入图像上滑动滤波器”。 对于每个滤波器位置,在滤波器和图像的相应区域之间执行逐元素乘法。 然后将这些乘积相加,在称为“特征图”或“特征图”。 此操作的结果是图像的转换表示,突出显示特定特征的存在或不存在。
在“滑动和比较”的类比中,我们可以将卷积视为检查图像不同部分的模式的一种方法。 就好像您在图像上移动一个“窗口”(滤镜),一次移动一个小区域,并向每个位置询问一个简单的问题:“这看起来像我正在寻找的图案吗?”
这个问题的答案是使用涉及乘法和加法的数学运算来计算的,并将结果记录在新的特征图中。 在图像中的几个不同位置重复此操作。
因此,卷积是在图像上移动该窗口(滤波器)、应用数学运算并记录每个位置的结果的过程。 当结果为正时,表示图像的一部分与过滤器正在寻找的模式匹配。 当结果为负数或接近于零时,表明未找到匹配项。
简而言之,在“滑动和比较”的类比中,卷积就像将图像与过滤器“比较”的行为,在每个位置提出一个简单的问题并记录答案以突出显示图像中与所学到的模式相匹配的区域。网络神经。
回到前面提到的卷积的定义, “卷积是一种线性算子,它从两个给定的函数得出第三个函数,该算子测量这些函数在它们的叠加所暗示的区域上的乘积之和,作为它们之间位移的函数。”
现在,让我们将其分解以便更好地理解:
线性运行,将是直接将一组数字相加和/或相乘的运算,无需复杂的应用,只需简单的加法和乘法即可。
应用于两个给定函数,在我们提出的示例中,滤波器将是第一个函数,分析的图像将是第二个函数。
它产生第三个函数,该函数测量这些函数的乘积之和,在这种情况下,第三个函数是由前两个函数(矩阵)的乘积相乘和求和所得的矩阵表示的图像。
沿着由于它们之间的位移而叠加所暗示的区域, 简而言之,“滑动比较”甚至“在图像上移动窗口”的类比无非是在整个图像上应用滤镜,比较各个部分并从比较中获得正或负结果。
总之,在本文中,详细探讨了卷积神经网络中的卷积运算(>)。 演示了如何应用这一基本数学运算从图像中提取重要特征,突出显示特定模式的存在或不存在。 “滑动和比较”的类比使我们能够将卷积可视化为查询图像与过滤器匹配的过程,并将响应记录在特征图中。
因此,了解卷积对于理解 > 的工作原理及其识别和分类图像的能力至关重要。
我希望这篇文章有助于阐明卷积神经网络中的这个基本概念。
1695173360
#从大脑到机器理解卷积神经网络中的卷积 #作者不编译 #年 #月
2023-09-20 01:18:52