内容发布更新时间 : 2024/12/30 0:16:09星期一 下面是文章的全部内容请认真阅读。
SIFT特征点匹配算法
基于SIFT方法的图像特征匹配可分为特征提取和特征匹配两个部分,可细化分为五个部分: ① 尺度空间极值检测(Scale-space extrema detection); ② 精确关键点定位(Keypoint localization) ③ 关键点主方向分配(Orientation assignment)
④ 关键点描述子生成(Keypoint descriptor generation)
⑤ 比较描述子间欧氏距离进行匹配(Comparing the Euclidean distance of the
descriptors for matching)
1.1 尺度空间极值检测
特征关键点的性质之一就是对于尺度的变化保持不变性。因此我们所要寻找的特征点必须具备的性质之一,就是在不同尺度下都能被检测出来。要达到这个目的,我们可以在尺度空间内寻找某种稳定不变的特性。
Koenderink和Lindeberg已经证明,变换到尺度空间唯一的核函数是高斯函数。因此一个图像的尺度空间定义为:L(x,y,?),是由可变尺度的高斯函数G(x,y,?)与输入图像
I(x,y)卷积得到,即:
L(x,y,?)?G(x,y,?)?I(x,y) (1.1)
其中:G(x,y,?)?12??2e?(x2?y2)/2?2
在实际应用中,为了能相对高效地计算出关键点的位置,建议使用的是差分高斯函数(difference of Gaussian)D(x,y,?)。其定义如下:
D(x,y,?)?(G(x,y,k?)?G(x,y,?))?I(x,y) (1.2)
?L(x,y,k?)?L(x,y,?)如上式,D即是两个相邻的尺度的差(两个相邻的尺度在尺度上相差一个相乘系数k)。
图 1.1
图1.1所展示的是建立DOG的一种实用的方法。初始图像与不同σ值的高斯函数卷积,得到一垛模糊后的图像,然后将这一垛模糊图像临近两两相减即得所对应的DOG。这些模糊后的图像以k为系数在尺度空间里被分隔开,并且该垛内最高的尺度应是最低尺度的2倍。为了能开展后续工作(与尺度空间极值检测相关,将在后续文章中作出解释)并满足上述要求,每垛需要通过卷积得到s+3个模糊后的图像,并且s和k需要具有关系k?21/s。
在一垛图像建立完毕后,还需要降采样得到下一垛图像的DOG。在实际操作中首先用2倍于第一垛图像的σ值建立出模糊图像,然后再将此垛图像降采样,即每2个像素抽出一个像素,就可以得到下一垛图像的DOG。
在上述工作完成后,所要完成的就是尺度空间的极值检测。DOG上的某个像素要和本尺度的8个相邻像素以及上下相邻尺度各9个相邻像素比较。这样做的目的是为了确保图像在尺度空间和二维图像空间均检测到极值点。如果该像素点在这所有参与比较的点中有最大值或者最小值,则认为该像素点是尺度空间的极值点之一。图1.2表示这种极值检测的原理。
图1.2
另外需要注意的是,上述的尺度空间极值点检测在每一个垛中都要进行。最后获得的
极值点总和是所有垛中所检测到的极值点的集合。那么如果这个极值点处在降采样后的垛中,则需要在找出他后将其坐标变换到原始大小的原图上。容易写出这个变换公式为:
x?2ox0,o?omin?[0,...O?1],x0?[0,...N0?1]?[0,...M0?1] (1.3)
其中x0是原始大小图像即原始图像上的坐标,经采样变换后变为x;o是处于垛的阶数(即处于第几个垛中);omin=0或者-1,当第一垛图像为原图经过尺寸加倍后的图像生成时值为-1,不经过加倍则为0。
另外在建立尺度空间的过程中有两个较为重要的参数要确定。可以将之描述为尺度空间抽样频率和空间域抽样频率。
尺度空间抽样频率表现为每个DOG垛所含有的DOG数目。由于每个DOG垛中最大尺度已经确定是最小尺度的2倍,则在这个范围内的DOG数目越多,抽样频率就越高。这个频率影响着特征提取的效果。Lowe教授在其文章中论述了对于该参数所做的实验。
图 1.3
实验表明在每个垛中有3个抽样时特征点提取效果是最好的(从图1.3左图可以看出,无论是变化过的图像中能取到与原图中相同的特征点的比例,还是所取到的特征点与数据库内特征点匹配上的比例都是最高)。而之所以更高的抽样频率不能带来更好的匹配效果,是因为抽样频率越高,虽然提取的特征点越多,但这样的特征点大多是不稳定的,因此无法提高匹配的成功率,这从图1.3右图可以看出。
另外一个参数是空间域抽样频率。表现为σ的数值。由于图像与高斯函数的卷积可以看作是空间滤波,则σ与滤波的截止频率有很大的关系。σ越大,截止频率就越小,能够看到的抽样值频率也越小。