ETM+(TM)蝕變遙感異常提取方法研究與應用——異常主分量的資訊量計算和...

  • 作者:由 匿名使用者 發表于 攝影
  • 2022-10-29

ETM+(TM)蝕變遙感異常提取方法研究與應用——異常主分量的資訊量計算和...中地數媒 2020-01-19

張玉君

(中國國土資源航空物探遙感中心,北京)

摘要:本文用機率論的中心極限定理理解許多遙感資料近似服從正態分佈的現象;用標準離差 σ作為異常主分量門限化的尺度;採用直方圖的夏農熵評價異常主分量的資訊量;並採用偏度和峰度聯合檢驗法對直方圖做正態性檢驗。透過資訊量計算和正態性檢驗評價了三種異常主分量的直方圖。

關鍵詞:中心極限定理;資訊熵(夏農熵,或平均資訊量);標準正態分佈;偏度;峰度。

引言

遙感資訊的處理是以機率論、數理統計和多元統計分析為數學理論基礎的,機率論的中心極限定理有助於理解遙感資料的許多現象

[1]

。我們在文

[2]

中提出了去干擾異常主分量門限化技術流程,異常強度等級是以異常主分量標準離差σ為尺度的,於是便思考以下問題:它與標準正態分佈是否接近?當改進主分量分析時所得異常主分量的資訊量增加多少?為此採用直方圖的夏農熵評價異常主分量的資訊量,並採用偏度和峰度聯合檢驗法對其直方圖做正態性檢驗。透過資訊量計算和正態性檢驗評價了三種異常主分量及其直方圖。

1中心極限定理

在影象處理中經常使用機率密度分佈曲線(簡稱直方圖),於是便產牛兩個問題:

(1)如何理解TM資料直方圖在許多情況下接近正態分佈?

(2)是否可以使用標準離差σ作為遙感異常切割的尺度?

在自然現象(以及社會現象)中,大量隨機變數都服從或近似服從正態分佈。作為極其重要自然現象的地質遙感學,其許多問題也都遵循正態分佈規律。例如,某一地區某種地質體或地物各波段反射波譜、其兩波段的比值、乃至整景ETM經主分量分析提取的異常主分量等,都近似地服從正態分佈。因此機率論和數理統計中與正態隨機變數相關的理論和概念在遙感蝕變資訊提取中起著特別重要的作用。

首先應理解的是機率論的中心極限定理。該定理的直觀解釋為:若一個隨機變數是由大量相互獨立的隨機因素的影響所造成,而每一個別因素在總影響中所起的作用都不很大,則這種隨機變數通常都服從或近似服從正態分佈。該定理還證明了,這些相互獨立的隨機因素可以是服從同一分佈(即有相同的數學期望和方差),也可以是不服從同一分佈(即有不同的數學期望和方差)。

中心極限定理可以幫助理解遙感資料的許多現象。例如,東天山尾亞雜巖體的形成取決於許多因素:入侵岩漿的成分、溫度、壓力、酸鹼度、空間分佈、後期剝蝕的物理化學條件等等,這些因素的變化是相互獨立而隨機的,每一因素的變化都起了一定但又不很大的作用,造成當今尾亞雜巖體的面貌;當然ETM所測到的尾亞雜巖體波譜特性還受衛星觀測系統靈敏度、穩定性、溫度、壓力等諸多因素的影響,這些因素的變化也是相互獨立而隨機的。圖1所示為尾亞雜巖體ETM各波段直方圖,各波段直方圖均近似服從正態分佈,此圖是用中心極限定理理解遙感現象的很好例項。在遙感蝕變資訊提取方法研究中,經常涉及多元統計分析,而多元統計分析的主要理論都是建立在多元正態分佈總體基礎上的,所以在這一研究中對正態分佈的理解具有特殊重要的意義。

圖1東天山尾亞雜巖體ETM各波段直方圖

2正態分佈和σ的借用

2。1正態分佈

早在1795年德國數學家高斯就推匯出偶然誤差或然率曲線的函式表示式即高斯分佈定律或正態分佈

[3]

,中心極限定理是數位數學家(Liapunov,Levy-Lindeberg,De Moivre-Laplace等)的進一步發展,為了簡單明瞭現僅列出高斯分佈:連續型隨機變數X的機率密度為

張玉君地質勘查新方法研究論文集

式中σ稱為標準誤差。如果取k倍的標準誤差,那麼任一觀測值的誤差介於±κσ之間的或然率P為:

表1或然率與誤差的關係

圖2或然率p與k的關係圖

結合我們的具體情況,如前所述,透過主分量分析(PCA)提取的羥基和鐵染蝕變異常(OHA、FCA)主分量,往往具有正態分佈的特點:

(1)只有一箇中心,即眾值;

(2)小偏離比大偏離出現的幾會多;

(3)大小相等、符號相反的正負偏離的兒率接近,直方圖近似對稱於y軸;

(4)極大的正偏離和極小的負偏離的機率都很小,直方圖向兩端迅速衰減。

故而產生借用σ作為異常主分量門限化的尺度。

表2切割水平

2。2σ的借用

TM資料處理以多元分析為基礎,多元分析中對應於誤差理論中稱之為標準誤差的σ,是標準離差(或標準偏差),其定義為:

張玉君地質勘查新方法研究論文集

既然TM資料及其線性處理結果一般均有近似正態分佈的直方圖(如圖3所示,為13739景羥基主分量直方圖),那麼我們在做異常切割或資料切割時便可借用σ這個表徵正態分佈曲線的尺度。例如,主分量分析結果可以把均值(X)理解為代表區域背景,利用(X+kσ)確定異常下限和劃分異常強度等級

[4]

。異常總面積可用(1-P)/2近似計算,其大小因景號而異。

圖313739ms直方圖對比

切割異常時有了這一尺度可以減少主觀任意性,並使操作較為規範化,為此做切割水平表(表2),此表是按下式計算的:

L=127。5+kσ*SF;或 L=127。5+kx127。5/4 H=L+1

式中 H、L分別為切割高、低門限值;k為倍數;σ為標準離差;SK為比例因子;σ和SK由主分量分析報告給出。

3夏農(Shannon)資訊量的應用

資訊需要定量描述,資訊含量的多少,稱為資訊量。1948年美國工程師C。H。Shannon給出了資訊量的數學公式[1]。對於資訊源的整體資訊量,Shannon定義為各資訊符號資訊量的平均資訊量(或稱資訊熵),用S(X)表示:

張玉君地質勘查新方法研究論文集

式中X為隨機變數,它取有限個值X={x

1

,x

2

,…x

n

),其值稱為資訊符號,資訊符號xi出現的機率為P

i

,i=1,2,…,n。且P

i

≥0,

現利用資訊量公式來定量評價我們對於異常主分量直方圖的改善。取13739景ETM+資料的子集13739ms(1620,5145,1200,820),括弧中前兩個數為起始列行數,後兩個數為子圖13739ms的大小。對此子影象分別做了三種羥基異常主分量:①僅做大氣徑輻射校正及去幹擾;②做大氣徑輻射校正及去幹擾,又做了無損失拉伸;③做大氣徑輻射校正及去幹擾,並限定異常主分量的輸出動態範圍為±4σ。此三種直方圖示於圖3中。從此圖可以直觀明顯地看出,直方圖的改善對於異常切割十分有利。首先將三種主分量分析的主要引數對比於下表(表3):

表3三種主分量分析的主要引數對比

將三種異常主分量的機率統計密度圖(直方圖)的數值輸出於表4,然後計算其各自的夏農資訊量。子圖13739ms的總畫素數為1200×820=984000;干擾窗畫素總數為131551;去幹擾後參與主分量分析的畫素數為852449。因為異常主分量直方圖是以128為“0”點,左半邊實為負異常值。由於我們僅對正異常感興趣,故只計算直方圖右半邊(灰階從128至255)的資訊量。將(3)式寫成可利用EL-5100C計算器進行迴圈計算的形式:

f(K

i

,C)=K

i

÷852449×ln(852449÷K

i

)+C CTO C(4)

式中 K

i

為具有灰階i的畫素數;K

i

÷852449=P

i

表413739ms三種羥基異常直方圖資料(表中每一列的右側數為灰階值;左側為像元數)

續表

續表

除了夏農資訊熵還計算了相對資訊量

及資訊剩餘度(γ=1-η)。現將計算結果列人表5:

表5三種異常主分量機率統計密度圖資訊量計算

由表5可見三種主分量分析所獲異常主分量中正值的平均資訊量(資訊熵)和相對資訊量依次增加,而資訊剩餘度依次遞減。這說明第三種異常主分量所含資訊量最大,最有利於異常門限化。

3直方圖的正態性檢驗

如前所述,及在

[4]

中我們曾寫過,結合我們的具體情況,部分或整景ETM透過主分量分析(PCA)提取的羥基和鐵染蝕變異常(OHA、FCA)主分量,往往具有正態分佈的特點。

現試用偏度和峰度聯合檢驗法

[5]

,對13739ms子集的羥基異常主分量機率統計密度圖(直方圖)做正態性檢驗。

該方法的主要理論依據是正態分佈密度曲線是對稱的、且陡緩適中。因此,被檢驗的資料若來自正態總體,則其經驗分佈密度(直方圖)就不能偏斜太多,也不能陡緩過分。為此數理統計提出兩個數字特徵,一個是描述分佈密度曲線的偏度γ

1

;另一個是描述分佈密度曲線的陡緩程度的峰度γ

2

。由機率論

[6、7]

得知,偏度γ

1

與峰度γ

2

可表示為:

張玉君地質勘查新方法研究論文集

式中 Eξ為隨機變數ξ的數學期望(均值);E(ξ-Eξ)

2

為ξ的方差,記為Dξ,稱

為ζ的標準差(根方差),即Dζ=E(ξ-Eξ)

2

根據矩估計法,可得樣本偏度和峰度的下述表示式:

張玉君地質勘查新方法研究論文集

對於正態分佈N(μ,σ

2

),γ

1

=0,γ

2

=3,因此,當原假設或零假設(根據實際問題要求所提出的一個關於隨機變數的一種論斷,稱為統計假設)H

0

為真時,對於用樣本值(x

1

,x

2

……,x

n

)算出的觀測值b

s

與b

K

應該分別接近0與3。

分別對13739ms子集的前述三種羥基異常主分量機率密度分佈經PCI統計出它們的標準差S相應為:2。2205;3。8412;31。2434。利用EL-5100C計算器按下述迴圈式計算出μ

3

和μ

4

右半邊 f(AB)=(A-128)

3

×B÷852449 STO C,C+D STO D,C×(A-128)+E STO E(9)

左半邊 f(AB)=(128-A)

3

×B÷852449 STO C,C+D STO D,C×(128-A)+E STO E(10)

式中 A為羥基異常主分景的灰階值;B為具有該灰階的像元數;最終的C為μ

3

;最終的E為μ4。

於是求出三種羥基異常主分量機率密度分佈的偏度bs與峰度b

k

,列入表6中:

表6三種羥基異常主分量機率密度分佈的偏度b

s

與峰度b

k

計算結果

從表6可以看出,用偏度和峰度聯合檢驗法對13739ms子集的三種羥基異常主分量直方圖所做正態性檢驗效果,以第三種(做大氣徑輻射校正及去幹擾,並限定異常主分量的輸出動態範圍為±4σ)處理所獲羥基異常主分量直方圖最接近正態分佈,其偏度b

s

為0。03,峰度b

k

為4。08。

5結論

以甲馬——驅龍火山-沉積盆地銅多金屬礦田為例(13739ms),展示了平均資訊量(資訊熵)計算結果及用偏度和峰度聯合檢驗法對13739ms子集的三種羥基異常主分量直方圖所做正態性檢驗效果。以第三種(做大氣徑輻射校正及去幹擾,並限定異常主分量的輸出動態範圍為±4σ)處理所獲羥基異常主分量所含資訊量最大,且其直方圖最接近正態分佈,其偏度b

s

為0。03,峰度b

k

為4。08。此研究的主要意義在於,改進了用於找礦資訊提取的主要方法——主分量分析的效果,並提供利用σ作為異常分層尺度的依據。

參考文獻

[1]袁志發,周靜芋。多元統計分析。科學出版社,2003

[2]張玉君,楊建民,陳薇。ETM

+

(TM)蝕變遙感異常提取方法研究與應用——地質依據和波譜前提[J]。國土資源遙感,2002,(4):30~36

[3]馮師顏。誤差理論與實驗資料處理,1964

[4]張玉君,曾朝銘,陳薇。ETM。(TM)蝕變遙感異常提取方法研究與應用—方法選擇和技術流程[J]。國土資源遙感,2003,(2):44~49

[5]莊楚強,吳亞森。應用數理統計基礎。華南理工大學出版社,2002

[6]周概容。機率論與數理統計,1984。

[7]盛騶,謝式千,潘承毅。機率論與數理統計,1995。

Study on the Methodology for the Abstraction of The Alteration Anomalies from the ETM

+

(TM)Data and Its Application—The Calculation of Information Content&Examination of The Normality for The Anomalous Principal Component Histograms

Zhang Yu jun

(China Aero-Geophysical Survey and Remote Sensing Center for Land and Resources,Beijing 100083,China)

Abstract: The central limiting theory of the probability helps understanding of the near standard distribution of the remote sensing data in many cases。The standard deviation σ was used for threshoding of the anomalous principal component。Using Shannon entropy evaluated the information content of the anomalous principal component。The distribution normality of the anomalous principal component histogram was examined by calculation of the deviation degree and the peak degree。Three different anomalous principal componenthistograms were compared too by these calculations。

Key words: Central limiting theory;Standard normal distribution;Information entropy(Mean information content);Degree of deviation;Degree of peak;Quantitative measure of anomaly slicing;Thresholding。

Top