内容发布更新时间 : 2024/11/9 14:37:14星期一 下面是文章的全部内容请认真阅读。
第二节 非监督分类
一、非监督分类的基本内涵
非监督分类指人们事先对分类过程不施加任何的先验知识,根据遥感影像地物的光谱特征的分布规律,对其特征值进行分类的方法。
非监督分类也称聚类分析。一般的聚类算法是先选择若干个模式点作为聚类的中心。每一中心代表一个类别,按照某种相似性度量方法(如最小距离方法)将各模式归于各聚类中心所代表的类别,形成初始分类。然后由聚类准则判断初始分类是否合理,如果不合理就修改分类,如此反复迭代运算,直到合理为止。
二、非监督分类的过程 1.核心问题
初始类别参数的选定,以及迭代次数的调整问题。
2.主要过程
(1)确定最初类别数和类别中心(任意的,随机的);
(2)计算每个像元对应的特征量与各聚类中心的距离,取距离最短的类别做为像元所属类别,计算新的类中心;
(3)计算每一像元与新的聚类中心距离,取距离最短的类别做为像元的所属类别,计算新的类别中心;
(4)判断迭代是否结束,若不是,继续迭代,若是,迭代停止,分类结束。
三、非监督分类的方法
主要采用聚类分析方法,常用的方法有ISODATA,称为迭代自组织分析技术,和K-Mean算法,称为K-均值算法。K-Mean算法的基本思想是通过迭代,移动各个基准类别的中心,直至得到最好的聚类结果为止。ISODATA是在初始状态给出图像粗糙分类,然后基于一定原则在类别间重新组合其样本,直到分类比较合理为止。
1.K-means算法
具体计算步骤:
(1)任意选择 k 个对象作为初始聚类中心;
(2)按照到聚类中心距离最小的原则对像元分类; (3)重新计算聚类中心;
(4)聚类中心不变,则算法终止,否则返回步骤②。
2.ISODATA算法聚类分析
ISODATA算法又称迭代自组织数据分析算法,在分类过程中根据一定根据一定原则不断重新计算类别总数和类别中心,使分类结果趋于合理。是目前非监督分类中使用最广泛的算法。
具体计算步骤:
(1)选择初始的类别平均估值;
(2)根据到训练样本类别中心最短距离划分像元的类别; (3)重新计算每种类别的平均值;
(4)若第②和③产生平均值相同或相近,则③的结果就代表分类结果,否则返回②。
四、非监督分类的特点和优缺点 1.特点
非监督分类只是对不同类别进行划分,并没有确定类别的属性,属性是分类后对各类别的光
谱特性或实地调查后确定。
2.优缺点
*优点:1 无需对分类区有较多的了解,仅需一定的知识来解释分类出现的集群组 2 人为误差减少,需输入的初始参数较少
3可形成范围很小但有独特光谱特征的集群,所分的类别比监督分类的类别更 均质
4 独特的覆盖量小的类别均能够被识别
*缺点:1 对其结果需进行大量分析及后处理,才能得到可靠分类结果 2存在同物异谱及异物同谱现象,使集群组与类别的匹配难度大 3不同图像间的光谱集群组无法保持其连续性,难以对比。
五、比较
与监督法的先学习后分类不同,非监督法是边学习边分类,通过学习找到相同的类别,然后将该类与其它类区分开,但是非监督法与监督法都是以图像的灰度为基础。