【研究成果】克羅內克積(Kronecker)包絡概念 有助維度縮減及影像資料處理

by Yang-Kuang Chao
347 觀看次數

撰稿  /  陳宣豪 (科學推展中心特約編輯)


圖1、Kronecker包絡PCA(實線)及一般PCA(虛線)的比較

矩陣或圖像數據的降維方法一直是個研究活躍的領域,而單粒子低溫電子顯微鏡(cryo-EM)是穿透式電子顯微鏡(TEM)在樣品處於超低溫(如液氮溫度-196℃)狀況下所進行之型態研究,最常被應用於以近原子分辨率解來​​解析3D宏觀的分子結構。國際期刊《Nature》當中的生物科學研究方法分冊《Nature Methods》,曾將cryo-EM低溫電顯喻為2016年的「年度最佳方法」,因此傳統研究人員在於低溫電顯圖像的分析過程,得先專注於2D聚類,目的在於識別出結構同質的圖像。

高維度統計方法的理論研究與應用

不過,高維數據的聚類是個極具挑戰的任務,加上低溫電顯圖像的訊號雜訊比(Signal-to-noise ratio,簡稱SNR)較低之特性,其所需訊號強度與背景雜訊強度不明顯的情況,讓這項任務變得更加困難。

國立中央大學數學系黃世豪助理教授早在擔任博士後研究學者期間,便已和統計領域相關學者,討論並合作關於高維度統計方法的理論研究與解決應用,包含充分維度縮減法的維度檢定、兩階段降維法的理論刻畫等。在大數據運用越來越頻繁的未來,透過研究所得之高維度方法理論,能協助其他領域的專家以更有效的統計工具來處理各種問題。在高維度資料分析的維度縮減問題研究中,曾指出在第一階段可透過考量空間結構的維度縮減法,有效提高第二階段典型相關分析之檢定力,這項發現即可應用於氣候學中的大氣遙測相關檢定。

透過Kronecker降維及萃取圖像主要資訊

同時過去有研究提出Kronecker包絡概念應用於降維,和在低溫電子顯微鏡圖像的數據分析中,使用Kronecker包絡PCA(Principal components analysis,簡稱PCA)來減少低溫電鏡圖像的維度,因此黃世豪助理教授與其合作團隊,透過兩步驟程序:將數據投影到多線性包絡子空間上,然後在投影核心張量上執行一般PCA。其中第一步的多線性包絡子空間可以大致濾除雜訊並有效降低高維圖像資料的運算時間;第二步的PCA也能將可能相關主要變量轉換為不相關變量,並進一步地萃取圖像的主要資訊。研究團隊透過數學理論證明Kronecker包絡PCA的大樣本理論性質,並推導出Kronecker包絡PCA的漸近正態性,將其與一般PCA 比較後,發現Kronecker包絡PCA的漸近總隨機變異小於一般PCA。研究團隊也從模擬實驗中發現當樣本數偏小,即便原始資料的訊號僅有部分服從Kronecker包絡結構,Kronecker包絡PCA仍能在偏誤-變異權衡考量下較一般PCA更為精準。

研究團隊並分析了中研院統計所杜憶萍研究員研究團隊,以低溫電顯圖像聚類和模擬研究的真實數據,來展示之Kronecker包絡PCA的優勢。杜研究員團隊在處理過程有「減少原始圖像維度」和「去高噪聲」,透過兩階段降維,第一階段讓原始圖像通過多線性主成分分析,將130×130減少到15×15並作為核心圖像,第二階段更進一步將這些圖像最終維數處理至20,最後的結果確實證明Kronecker能作為PCA另一個實用的替代方案。

黃世豪助理教授的研究成果,無疑是為杜研究員團隊的分析工具理論,給予了相當程度的支持。而未來此方法,將可大量活用在低溫電子顯微鏡影像分析中。

你可能也想知道

X