造价通

反馈
取消

热门搜词

造价通

取消 发送 反馈意见

方向选择性模型及其在图像处理中的应用前 言

2022/07/16108 作者:佚名
导读:图像理解是计算机视觉领域中的一个核心问题。对图像理解而言,关键的一步是提取图像中构成场景语义结构的特征并将其表征为高层任务容易利用的形式。一种传统的特征提取方法为先寻找边缘,然后形成直线或组合轮廓线。这些特征为图像高层语义的理解提供了基础。 传统的特征提取方法在一定程度上取得了很大进展,目前有大量针对边缘检测、直线检测以及轮廓检测的算法。然而,由于这些算法本质上都是依赖边缘检测的,所以都存在一些显

图像理解是计算机视觉领域中的一个核心问题。对图像理解而言,关键的一步是提取图像中构成场景语义结构的特征并将其表征为高层任务容易利用的形式。一种传统的特征提取方法为先寻找边缘,然后形成直线或组合轮廓线。这些特征为图像高层语义的理解提供了基础。

传统的特征提取方法在一定程度上取得了很大进展,目前有大量针对边缘检测、直线检测以及轮廓检测的算法。然而,由于这些算法本质上都是依赖边缘检测的,所以都存在一些显著的问题,如对边缘检测的结果依赖性过高及需要人工设定的参数过多等。一般来说,这些算法都是单纯从计算的角度尝试定义问题,而往往忽略问题的本质,即生物视觉系统如何完成边缘―直线―轮廓检测的生理机制,所以难以从根本上解决这些问题,更难以解决基于这些结果的更高层的图像理解任务。

对人眼而言,视觉场景中最显著的特征就是不同颜色形成的边缘,以及边缘形成的直线、曲线和更复杂的形状。本质上,我们看到的直线及曲线都可以看作相同或不同方向的短直线的分段组合。

因而,本书将方向(短直线)看作对图像理解最有意义的一种特征。显然,方向这一初级特征高于像素颜色、灰度等底层特征,又低于轮廓等高层语义特征。作为基于神经科学的人工智能和认知科学的跨学科研究,本书尝试利用生物视觉系统检测方向的神经机制,设计一个仿生学的方法,从根源上实现特征提取及表征这一基本问题的解决,进而为更复杂的任务提供生理基础。

在视觉神经科学中,简单细胞的方向选择性一直是一个热点问题。诺贝尔生理学奖获得者David Hubel 和Torsten Wiesel 提出过一个简单细胞的感受野模型(以下简称Hubel-Wiesel 神经模型),该模型用几何形式的约束解释了简单细胞对条形刺激的方向选择性。一方面,该模型具有简单朴素的形式;另一方面,该模型也有不少的缺陷,因而受到了许多挑战。尽管如此,目前没有严格的证据直接支持或者否定这个经典的模型。

本书在Hubel-Wiesel 神经模型的基础上,提出一个方向计算的双层网络模型(以下简称本书模型)。与Hubel-Wiesel 神经模型相比,本书模型对底层神经元的限制更少,对刺激形式的要求更低,且实现了每一层计算的细节,因而灵活度更高。数值仿真实验表明,本书模型能够很好地模拟简单细胞的方向选择性。

利用方向计算模型,本书进一步提出一个图像的方向检测算法(以下简称本书算法)。在合成图像及自然图像上得到的实验数据表明,该算法能够从复杂图像中提取满意的方向图。与传统算法得到的边缘图、直线图等相比,方向图突出显著语义特征而抑制琐碎干扰信息,更接近物体的真实轮廓图,因而促进了分割及识别等高层任务更好更快地完成。此外,本书算法对参数调节的依赖更低、可并行计算程度高。

作为模型的应用之一,本书巧妙地将方向检测算法用于解释几种著名的几何视错觉。本书用定性计算的方法从局部探索错觉的产生机制,生成了与人眼观察理解相似的错觉现象,并将这种方法推广到一系列错觉的解释。作为更深层次的应用,本书最后尝试利用单幅图像的方向图,恢复其中场景的部分三维信息,也取得了一定的成果。

本书正文部分安排如下:第1章介绍相关研究的现状与本研究的主要内容及特点;第2章介绍本书模型建立的生理基础与依据;第3章介绍模型的底层设计,讨论外侧膝状体细胞对刺激的响应函数;第4章介绍模型的顶层设计,讨论简单细胞利用传入外侧膝状体对刺激的响应确定边缘方位的几种计算方法;第5章用数值实验证明模型的正确性与可行性,确定模型中参数的优化取值,并使用仿真实验模拟形成简单细胞具有方向选择性的感受野;第6章介绍基于方向选择性模型的方向检测算法在图像表征、分割及匹配等方面的应用;第7章将方向检测用于解释一系列几何视错觉;第8章利用单幅图像的方向图部分恢复场景的三维信息;总结部分总结全书并展望后续研究课题。

作为我的第一本学术著作,本书包含了2007s2013年我在复旦大学攻读研究生期间的主要研究成果,也是我的博士学位论文的主要部分。许多人对本书的完成提供了不可或缺的帮助和启发。首先要感谢父母对我的养育之恩;感谢王晓梅师姐为本书第2章的写作提供了大量参考资料,感谢肖锦文师弟为本书第6章6.4.2节提供了实验数据;最要感谢我的导师危辉教授,从课题选择、数学建模、算法设计到实验分析等各环节都凝聚着危老师的辛勤指导,是他的精心培养才使我顺利完成了学业。

本书既然是对之前研究成果的总结,自然不是终结,而是后续工作的起点。本书中悬而未决的问题与不尽理想的结果都是我正在研究的重要课题,也是我未来的研究方向。作为一名追求科学的年轻学者,这是我第一次撰写学术论著,书中难免包含不严谨之处甚至错误,敬请学界前辈与同仁不吝赐教。

*文章为作者独立观点,不代表造价通立场,除来源是“造价通”外。
关注微信公众号造价通(zjtcn_Largedata),获取建设行业第一手资讯

热门推荐

相关阅读