【研究成果】統合分析新策略 有效處理存在異質性之整合數據

by Yang-Kuang Chao
781 觀看次數

撰稿  /  張鳳吟 (科學推展中心特約編輯)


實證醫學(evidence-based medicine)相較於傳統上醫師根據自身的臨床經驗制定治療方針,是以客觀、科學的方式,系統性回顧大量臨床文獻,以生物統計方法整合各研究結果,來制定最適當的醫療決策。這種整合多方資料來源進行統計分析的方式稱為「統合分析」(meta-analysis),最早於1976年由精神分析師Gene Glass提出,用於心理治療的評價上。許多小型臨床研究,常因樣本數不足無法顯現統計上的重要性,統合分析便成了非常有用的工具,可有效提高樣本數,以獲得更佳的檢定力。

統合分析的資料來源包含整合別人已發表、互相獨立的外部研究結果(Aggregate Data,AD),以及原始個別受試者資料(Individual Participant Data, IPD)。IPD有比AD更多、更詳盡的資訊,讓研究人員可以有較大的分析操作空間,包括端點定義、共變數(covariates)、分析方法的標準化等,也可進行共變數處理與子群分析的檢驗。不過由於受試者資料牽涉到隱私問題,IPD統合分析在實務上比較受限。近年來,愈來愈多研究嘗試整合IPD與AD,以發展更彈性、更有效率的統合分析策略。然而,傳統的方法常忽略AD具有不同的形式及不確定性,或是未考慮IPD與AD數據間的異質性(heterogeneity),這些效應可能會使得統合分析的結果無效。為此,清華大學統計所鄭又仁副教授希望能建立一個統一的架構,能夠同時說明外部研究的不確定性,以及各研究間的異質性。

鄭又仁教授團隊與UCSF流行病學與生物統計系黃瓊玉教授合作,提出整合半母數轉換模型(semiparametric transformation model)下IPD與AD的經驗概似架構(empirical likelihood-based framework),研究中利用t年存活率的外部研究,來提升估計效率與預測準確性,其成果發表於生物統計的頂級期刊《Biometrics》[1]。t年存活率是存活分析(survival analysis)摘要統計中的常見形式,鄭教授團隊利用經驗概似方法來整合半母數轉換模型下IPD與t年存活率的資訊,接著,團隊將經驗概似擴增,加入常態機率密度項(normal density term)來表示外部研究數據的不確定性。在從t年存活率得到的動差約束(moment constraints)中,取得擴增經驗概似最大值,我們可估計半母數模型中的迴歸參數。當內、外部研究間存在共變數分布的差異(即群體異質性),團隊引進密度比模型(density ratio model)來描述此異質性,並重新評估密度比模型下摘要資訊的動差約束。因此,將受制於新動差約束的擴增經驗概似取最大值,即可得到同時考慮外部研究不確定性及內外部研究間群體異質性的估計量(estimator)。除此之外,在估計密度比模型因額外參數組所損失的效率,可被增加的額外約束所彌補。

數值模擬

為了評估所提方法之效能(performances),團隊利用半母數轉換模型中兩種特殊情形:Cox 模型與比例勝算模型(proportional odds model),來進行數值模擬研究。模擬結果顯示,當群體不存在異質性時,所有方法對母數估計的偏差都很小;相反地,當內部與外部資料間存在異質性,在未引進密度比模型時會產生很大的偏差,加入密度比模型後產生偏差變小,同時估計的效率增加。

方法學應用:胰臟癌資料分析

最後,鄭教授團隊將提出的方法學應用於分析約翰霍普金斯大學1998年到2007年209位接受胰臟切除的胰臟癌患者,以辨識胰臟癌存活的預後因子。其中,淋巴結狀態的效應是非常重要的預後因子,然而樣本數不足以達到統計重要性。為了增加估計效率,團隊加入116位不同淋巴結狀態病人3年存活率的外部報告(Ahmad et. Al, 2001 ),從其共變數摘要統計可知,margin-positive與node-positive的病人比例與內部研究存有相當大的異質性。團隊因此建構margin與node狀態的密度比模型。結果顯示,相對於傳統方法,在Cox模型下相對效率為2.046,比例勝算模型下相對效率為1.75,且淋巴結效應的樣本達到統計重要性。最後團隊根據赤池信息準則(Akaike information criterion,一種評斷統計模型複雜度與擬合數據之優良性的準則)選擇比例勝算模型為較適合此資料的模型,得到結論為node-positive病人比node-negative病人在任何時間死亡的勝算比率為2.404。


參考文獻

[1] Yu-Jen Cheng*, Yen-Chun Liu , Chang-Yu Tsai, and Chiung-Yu Huang, Semiparametric Estimation of the Transformation Model by Leveraging External Aggregate Data in the Presence of Population Heterogeneity, Biometrics(2022).

你可能也想知道