【研究成果】提出優化p值合併法 為醫學與基因研究的統計工具加分

發表者 SPEC科學推展中心

26 觀看次數

撰稿 /  張鳳吟(科學推展中心特約編輯)


 

「身體質量密度(BMI)與某種癌症病人的存活是否有相關性?」「這基因是否和某種疾病相關?」這些問題常利用虛無假設(null hypothesis)來做檢定,從p值決定這假設是否為真,一般p值小於或等於0.05稱為具統計顯著性,否定該虛無假設的命題。社會科學與生醫方面的研究常需統合各方研究資料,合併多來源的p值,來幫助研究者做最終的判斷,舉例來說,實證醫學利用統合分析方法,結合各家醫院的研究結果,來制定最佳的治療方針,因此,p值合併成為假設檢定非常重要的課題。


p值合併的概念最早來自羅納德•費雪(Ronald Fisher)爵士,他於1925年發表的著作《研究者的統計方法》(Statistical Methods for Research Workers)中,引入p值的概念,並提出費雪法作為統合分析中合併多研究的整體統計檢定方法。一般p值合併的策略,是結合K件資料的p值\(( \vec{p}=(p_{1},...,p_{K}))\)產生整體的檢定統計,測試任何信號之存在。依據輸入數據與訊號的類型,近代發展出許多p值合併法,可分為三大類:(1) 結合來自少數且固定\((K~5-30)\)的獨立研究之p值,產生pi的樣本數\(n_{i}(1 \leq i \leq K)\)多,可接近無窮大,範例如費雪法與Stouffer法;(2)結合大量獨立研究p值\((K~ \infty)\),少部分p值具有弱信號(其它沒有),代表性方法為High criticism(HC)法與Berk-Jones檢定;(3)整合信號稀疏的未知相關性結構的p值,例如Cauchy檢定(CA)與harmonic mean檢定(HM)。


國立中山大學應用數學系張中教授是特聘年輕學者獎得主,他與匹茲堡大學生物統計系曾建城教授團隊一同合作,檢視多種合併法並提出優化的檢定方式,兩項成果發表於中華統計學誌《Statistica Sinica》[1][2]

 

第一項工作[1],團隊審視大樣本數情況下多種p值合併的檢定力及其漸進效力,同時評估有限樣本的數值表現(圖1)。團隊發現費雪法及adaptive Fisher procedure(AFp)有好的表現,因此,他們提出一種稱為Fisher ensemble (FE)的方法,結合兩種p值合併方式的長處。他們證明,在大樣本下,這個方法不亞於任何一個被它結合的方式,在有限樣本情況下,模擬也驗證了這方法經常比被它結合的方式表現更好(圖2)。

 

圖1、比較不同合併法相對信號頻率\((l / K)\)的檢定力。

 

圖2、有限樣本下比較FE與所合併方法(Fisher、AFp)信號頻率\((l / K)\)的檢定力。

一個基因上被結合的位點常有數百數千,位點間有相關性,且通常只有很少數的位點和這個疾病相關,因此要考慮的p值合併問題是要結合高維度的p值,且p值彼此相關且信號稀疏。這是近些年p值合併研究的主要問題之一,團隊第二項工作[1],是考慮厚尾分布(heavy-tailed分布或regularly varying tail分布)提出一大類p值分布的檢定量,Cauchy檢定與harmonic mean檢定都是其特殊案例。團隊證明這一大類的檢定量都有以下性質:

 

(a) 當設定的顯著水準很小時,在常用的條件假設下,不管p值之間的相關性為何,它對於型一誤差 (type I error) 會有很好的控制。

(b) 這類的方法在非常稀疏信號下在大樣本時會有最佳的檢定力(在detection boundary的意義下)。

 

張中教授表示,現代數據科學面臨數據結構複雜化的挑戰,有效的統計方法將有助於新的科學假設。

 


 

參考文獻

[1] Fang, YS; Chang, C*; Tseng, GC*, “On P-Value Combination of Independent and Non-sparse Signals: Asymptotic Efficiency and Fisher Ensemble”, STATISTICA SINICA. 34, 2237-2263, 2024

[2] Fang, YS; Chang, C*; Park, Y; Tseng, GC.,” Heavy-tailed distribution for combining dependent p-values with asymptotic robustness.”, STATISTICA SINICA. 33, 1115-1142, 2023.