[关闭]
@novachen 2020-03-30T15:49:01.000000Z 字数 1588 阅读 1850

海量高维度数据如何一眼看破

多光谱 高光谱


问题

随着高分六号的波段达到8个,中国的陆地遥感卫星已经脱离了传统的4波段(可见光三波段加上近红外)的模式,而美国的陆地卫星和欧空局的哨兵二号都有十个左右的波段。而且我国的卫星高光谱传感器似乎走的比国外更快,珠海一号已经能提供10米分辨率的几十个波段的量产高光谱数据了。

那么有一个关键的问题就摆在我们面前,如何用一张彩色图像集中地表达在这样多波段数据中的有效信息。目前对于多光谱卫星数据我们一般会根据应用的需要选择不同的波段组合。

比如这个Landsat8的波段介绍和组合推荐

但是如果碰到有几十个甚至上百个波段的高光谱数据,那也不好按照上面的套路来建议了。

有的软件显示一个所谓的数据立方体

最上面的显示一般用的就是可见光真彩色没问题,侧面的那种显示还是比较适合某个一维剖面的分析,而几个面内部的信息完全无从得知。但是这个也就看着好看而已。

有个行之有效的处理方法就是主成分分析(PCA),把高维的数据降维来看,如果选择主成分分析的前三个波段就可以形成一个能最大程度展示数据集信息量的假彩色图像。


上面是可见光组合,下面是PCA

主成分分析的最大问题是图像的颜色其实和地物的物理意义毫无关系,只表达数值上的距离。因此阅读感觉并不太好,特别是对于普通的读者。

还有一种办法是先对数据做分类,然后制作成分类专题图,给定一些符合常识的颜色来表达地物,比如树林用绿色,水体用蓝色等等。

但是分类图实际上让大量有效信息消失了,它实质上是将几十个波段的信息压缩到一个波段而且还是离散表达,可想而知这里的损耗有多少。

方案

那么有没有介于两者之间的更好的表达方式呢?

这里推出我的一个工具,它针对一个多波段的三维数据集或者在加上时间序列的四维数据集,用户可以给定一个参考图像,然后工具以参考图像为蓝本,将原数据集中的信息尽可能的注入这个蓝本中,形成一个基本色调安排符合用户事先的设定,又能包含大部分数据集中的信息,特别对地物的类别审视有关的内容。这个工具被叫做“变色龙”(chameleon),因为它会根据背景的不同,改变表达的方式,结果将和背景相协调。

比如我们在一个欧比特的高光谱卫星数据测试集(白洋淀)上做个例子。

先做个最普通的可见光三波段组合,波段序号分别为14-7-2。


可见光组合

如果采用主成份分析并且保留前三个波段构图

PCA结果

如果将前面的可见光图像作为参考,让变色龙软件在此基础上,将原数据集的信息注入。

变色龙结果

将主成分分析PCA和结果图OUT做个动图以比较两者差异

可以看到这两个图像有很强的映射关系,但是颜色完全不同。也就是说OUT基本上包含了PCA的信息,但是颜色表达方案迥异。

再将参考图REF和结果图OUT做个动图以比较两者差异

可以看到OUT对REF的颜色的改变远小于PCA,而且OUT更加接近一个分类的图,把大的类别上的差异突出了,而把小的差异减少了。比如房屋的屋顶的颜色红色或者蓝色其实只反映在可见光部分,就被削减了。OUT图因为包含了整个数据集的32个波段的信息而REF只包含其中3个,所以可以看到REF噪声很强,而OUT信噪比高、非常光滑。


其实这个参考图像还可以弄成很多稀奇古怪的样子,比如以前做的一些实验。

觉得河流应该用蓝色表示,所以就用photoshop人为地把原来可将光图像中黑色的河流改成蓝色的,其他地物内容不变。

可以看到算法在冲突最小的情况下把河流的颜色向用户想要的方向上调整了,其他部分基本上看不到变化。

初略的做一个分类(分辨率比现有的图像低),然后将几个类别各自附上一个颜色,作为参考图像。

这个其实是想演练一个想法,如果用MODIS的密集时间序列可以做一个空间上比较粗但是地物类型上比较准的分类结果,然后应用到landsat数据上,相当于画画先画个草稿然后再画细节。


陈甫
chenfu@aircas.ac.cn
中国科学院空天信息研究院

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注