【研究成果】醫療開放資料庫之25年影響評估：隱私及隱私增強技術

跨領域數學研究亮點

【研究成果】醫療開放資料庫之25年影響評估：隱私及隱私增強技術

發表者

1176 觀看次數

撰稿 / 張鳳吟（科學推展中心特約編輯）

審訂 / 盧鴻興教授（陽明交大統計學研究所/高雄醫學大學人工智慧生醫研究院）

醫療開放資料庫之25年影響評估：隱私及隱私增強技術

　　自1999年由哈佛醫學院及其附屬教學醫院、波士頓大學、麥基爾大學與麻省理工學院合作建立PhysioNet以來，醫療開放資料庫的發展逐漸成為生物醫學研究的重要趨勢。PhysioNet作為生理訊號領域中具代表性的開放資料平台，不僅提供多樣化的生理訊號資料與相關開源軟體，亦透過年度挑戰競賽促進研究人員開發創新演算法以解決複雜的生物醫學問題，例如利用心電圖偵測阻塞性睡眠呼吸中止症等。PhysioNet建立之後，全球陸續推出多個重要的醫療開放資料庫，促進了更具合作性與透明性的研究環境，並對生物醫學研究產生深遠影響。研究人員得以運用這些大型資料庫分析大量健康資訊，進一步發掘潛在的疾病機制與臨床應用價值。例如，UK Biobank提供大規模基因與健康資料，已廣泛應用於探討基因、生活型態與疾病之間的關聯；同時，透過整合神經影像資料（如結構磁振造影）建立人工智慧模型以預測阿茲海默症風險。在心血管研究中，相關資料亦被用於發展風險預測模型，以提升重大心血管事件之預測能力。此外，Kaggle等平台亦透過競賽機制促進資料共享與方法創新。

然而，隨著醫療開放資料庫的快速發展，資料隱私與安全議題亦逐漸受到重視，如何在促進資料共享的同時兼顧隱私保護，已成為重要研究課題。近年來，隱私強化技術（Privacy-Enhancing Technologies, PETs）被廣泛應用於此類問題之探討。在國科會支持下，國立陽明交通大學、台北榮民總醫院、中央研究院及國立台北護理健康大學所共同組成的SMART (Smart Medical AI and Repository Taskforce Center)團隊 [1]，系統性回顧近25年醫療開放資料庫的發展，並探討PETs在提升模型準確性與保障資料隱私之間的平衡，其相關成果已發表於《Journal of Medical Internet Research》[2]。

開放資料與病患隱私

　　醫療資料通常涉及到病患的敏感資料。1996年，美國通過《健康保險可攜與責任法案》（Health Insurance Portability and Accountability Act, HIPAA），並於後續制定相關隱私規範，明確定義18類受保護的健康資訊，包括姓名、住址、電話號碼、社會安全碼及生物特徵等，並要求資料共享前必須完成去識別化處理。然而，去識別化的過程往往複雜且容易出錯，亦增加資料共享的成本與門檻，進而對資料流通造成限制。

　　為兼顧「資料利用」與「病患隱私保護」，差分隱私（Differential Privacy）、合成資料（Synthetic Data）、同態加密（Homomorphic Encryption）、安全多方計算（Secure Multiparty Computation）以及聯邦學習（Federated Learning）等隱私增強技術被提出，以維持資料應用與隱私保護之間的平衡。其中，聯邦學習是一種去中心化的機器學習架構，近年來於醫療領域的應用日益增加，它讓各醫療機構在不交換原始資料的前提下，僅透過交換模型參數開發機器學習模型來共同訓練AI，極大強化了資料主權與隱私保障。然而，聯邦學習仍面臨資料異質性與模型透明度等挑戰。為解決此問題，SMART中的國立陽明交通大學盧鴻興教授團隊提出「聯邦學習動態合成影像（Dynamically Synthetic Images for Federated Learning）」方法[3]，透過整合多機構之異質資料以提升模型效能。其核心為一動態訓練機制：在每一輪訓練開始時，利用當前的全域模型評估各醫院自己的本地資料，識別錯誤分類的影像，並基於這些樣本生成新的合成影像，進而擴充原始訓練資料，使模型能學習先前未充分捕捉之特徵。實驗結果表明，此方法相較於傳統聯邦學習具有更佳的預測準確率，其整體表現媲美傳統的集中式學習架構，特別對於擁有較少數據或異質數據較多的機構具有顯著效益。

臺灣：醫療AI、資料平台與動態同意系統

　　自全民健保推動晶片健保卡系統以來，臺灣在醫療資料共享方面亦取得顯著進展，特別是在隱私保護與電子健康紀錄交換等領域。SMART團隊，於2023年10月推出「健康資料授權服務平台（Health Data Authorization Service Platform）」，作為醫療AI與資料共享平台 [4]。該平台目前已釋出17個資料集，涵蓋神經相關疾病、腦瘤、眼科疾病、肌肉骨骼疾病及心肺疾病等多個臨床領域，旨在促進醫療AI研究的發展；並導入動態同意機制（dynamic consent system），讓資料擁有者可即時調整其資料共享偏好，且能針對不同資料類型（如電子病歷或醫療影像）授予或撤銷特定用途之使用權限。相較於美國常見之「一次性廣泛同意」模式，此機制更符合歐盟《一般資料保護規則》所強調「可持續且可撤回」之精神。

結語

醫療開放資料庫的普及顯著加速醫療AI的發展，並進一步推動疾病診斷與治療策略之創新。隨著開放科學與聯邦學習等技術持續演進，醫療開放資料庫在形塑未來醫療體系中將扮演著關鍵角色，不僅有助於提升臨床決策品質與病患預後，亦促進建立一個兼顧倫理規範與隱私保護之全球研究生態系。

Reference

[1] SMART: Smart Medical AI and Repository Taskforce Center. Taiwan AI Center of Excellence (Taiwan AICoE) Project. URL: https://www.twaicoe.org/smart-smart-medical-ai-and-repository-taskforce-center/

[2] Yang A, Pan ML, Lu HH, Lien CY, Wang DW, Chen CH, Tarng DC, Niu DM, Chiou SH, Wu CY, Sun YC, Chen SA, Wang SJ, Sheu WH, Lin CH. Assessing the Evolution and Influence of Medical Open Databases on Biomedical Research and Health Care Innovation: A 25-Year Perspective With a Focus on Privacy and Privacy-Enhancing Technologies. J Med Internet Res. 2026 Jan 30

[3] Wu JCH, Yu HW, Tsai TH, Lu HHS. Dynamically synthetic images for federated learning of medical images. Computer Methods Programs Biomed. Dec 2023;242:107845

[4] Taiwan medical AI and data portal. NYCU Data Management Center. 2023. URL: https://data.dmc.nycu.edu.tw/

回上頁

跨領域數學人工智慧