摘要 滤波作为计算机视觉中常见的一种操作,一般用于降噪、边缘提取等操作。滤波一般通过卷积操作完成,根据需要可以定制卷积核,实现均值/高斯/中值滤波。 卷积操作 卷积操作的示意图如下,给定卷积核g和图像f,卷积后的图像表示为 $$ (f*g)[m,n] = \sum_{k,l}f[m-k,n-l]g[k,l] $$ 根据上述公式中的负号,卷积核实际使用时,是将核上下左右翻转后再作用在图像f上。当然这个操作在实际编程时已经被淡化,只不过卷积定义要求了负号(翻转) 卷积具有两个特性: Linearity,即$filter(f_1+f_2) = filter(f_1)+filter(f_2)$ Shift invariance,即$filter(shift(f)) = shift(filter(f))$ 以上两个性质说明任何具有平移不变性的线性操作都可以用卷积操作表示。除此之外,卷积操作还满足交换律、结合律、分配律、数乘等操作。 卷积操作会改变图像的大小(联想deep learning中卷积层的padding),那么如何填充原始图像,保证结果图像和原图保持大小一致就是一个值得思考的问题。
Axuanz
Updating as per fate.