撰稿 / 林宗儀 終身特聘教授 (國立中興大學統計學研究所)
閱讀,所有學習的關鍵起點
閱讀與理解是孩子在學業生涯初期最基本且最重要的能力之一,這項能力奠基了孩子的未來學習發展過程。根據 RTI International(2011)的研究,閱讀與理解能力較弱的孩子,比起那些能夠順利閱讀與理解的孩子,更容易面臨學業落後、重修年級或甚至輟學的風險。這不僅影響他們的語文學習,也會進一步限制其他學科(如數學、自然與社會科學)知識的吸收與應用,形成累積性的學習差距。長期而言,閱讀理解能力的不足可能降低學習動機與自信心,對未來的教育機會與就業前景亦造成不利影響。因此,早期發現與培養兒童的閱讀與理解能力,對提升其整體學習成就與終身發展具有深遠的教育與社會意涵。
以EGRA為核心的早期閱讀診斷
「早期年級閱讀評量」(Early Grade Reading Assessment,簡稱EGRA)是由美國國際開發署(United States Agency for International Development,USAID)於2006年所研發的一項測驗。此評量工具旨在測量低年級學生為了理解閱讀內容,並在其他學科及高年級學習中取得成功所需的關鍵閱讀技能。自推出以來,EGRA已在全球超過60個國家廣泛應用,並被改編為100多種語言,使其能夠因應不同語言與文化脈絡下的教育需求。該工具不僅有助於教師與教育決策者掌握學生在閱讀流暢度、詞彙辨識與理解能力上的發展現況,也能作為政策制定與教學改進的重要依據,進一步推動全球基礎教育品質的提升。
EGRA在拉丁美洲及加勒比地區的首次施測案例為祕魯,分別於2005年以西班牙語進行,並於2007年以克丘亞語(Quechua)施測,標誌著該工具在多語環境中應用的重要起點。EGRA採口頭施測方式,內容涵蓋字母原則、音素意識、詞彙、流暢度及理解力等多個核心閱讀面向。此測驗設計包含限時與非限時兩類任務:限時任務(如字母辨識或詞彙朗讀)可更精確地評估學生在閱讀技能發展過程中的熟練度與自動化程度,反映其在實際閱讀中的流暢表現;而非限時任務(如聽力理解與閱讀理解)則著重於測量學生對語言內容的理解深度與準確性。透過這兩種任務的互補設計,EGRA能夠全面揭示學生在早期閱讀學習中的能力結構,並為教育政策與教學策略提供具體的診斷依據與改進方向。
在EGRA測驗中,學生需完成多項限時子測驗,包括辨識字母、單詞與片語等。這些子測驗的設計旨在評估孩子是否具備以下基礎閱讀能力:理解文字的閱讀方向、識別句首或句尾的單詞,以及將單詞分解為音素等核心技能。通常,子測驗的表現會以學生在限定時間內正確辨識的字母或單詞數量來呈現,每位學生完成每項任務的時間限制為1分鐘。雖然這些測驗能提供豐富的閱讀能力資訊,但由於任務設有時間限制,部分學生可能在時間用盡前尚未完成所有題目,造成其觀察結果呈現部分未觀測的情形,其可視為「設限資料」(Censored Data),而對此類型資料進行深入分析並非易事。在分析這類資料時,必須考慮時間限制對測驗結果的影響,才能更精確地評估學生的實際閱讀能力與熟練度,並避免因直接使用原始分數而低估或高估學生的閱讀表現。
具設限值的混合t因子分析器(MtFAC)
本研究的動機源自對祕魯所蒐集的EGRA資料的分析。這些資料呈現出異常觀測值與厚尾雜訊,使得傳統假設常態分佈的分析方法並不適用。相較而言,多變量t分佈以其厚尾特性聞名,能容許資料中存在極端值或離群觀測值,從而在處理具有厚尾行為或極端離群值的反應變數時,更具穩健性與適用性。本研究旨在擴展多變量t因子分析器(Multivariate t Factor Analyzer with Censoring; MtFAC; Lin and Wang 2022)方法的架構,將其應用於有限混合之迴歸模型中,進一步連結外部解釋變量與截尾(Truncation)反應變數之間的關聯。透過此方法,不僅能有效處理資料中厚尾與異常值的問題,還能提供對學生閱讀能力與相關因素間關係的更精準估計,進而對教育評量與政策決策提供更具可信的依據。
數據資料之視覺化
為了說明本研究所提出的方法,我們採用了2007年祕魯EGRA資料中的一個子集,其包含502名學生的觀測資料。在這些資料中,我們聚焦於每位學生在1分鐘內個別施測的10項測驗中的4項,分別為(一)能辨識的字母數、(二)能辨識的簡單單詞數、(三)能解碼的無意義單詞數、及(四)能正確閱讀的段落單詞數。這四項測驗反映了學生在字母認知、詞彙辨識、音素解碼及閱讀流暢度等不同層面的閱讀能力,能夠作為分析學生早期閱讀技能的核心指標。透過這些指標,我們可以更精細地評估學生在限時閱讀任務中的表現,並進一步探討外部解釋變量對其閱讀能力的影響。
由於這四項測驗皆設有1分鐘的時間限制,因此可將流暢度分數轉換為速度尺度,即每秒辨識的字母或單詞數。具體而言,此指標透過將學生「正確辨識的字母或單詞數」除以「實際作答時間(不超過60秒)」計算而得。依此定義,速度分數越高,代表學生在西班牙語閱讀流暢度上的表現越佳,也反映其閱讀技能的熟練度與自動化程度。這種轉換不僅使學生之間的比較更為公平,也便於後續統計分析中對流暢度與其他變數之關聯進行量化評估。
由四項任務的速度測度在性別、年級、居住區域及年齡之間的分佈情形(如圖1)顯示出所有解釋變數在各反應測度上皆呈現明顯差異,意旨這些因素對學生閱讀流暢度可能具有顯著影響。除此之外,每個反應變數中皆存在一定數量的離群值或極端觀測值,這進一步支持了採用具厚尾特性的多變量 t 分佈來建模的合理性,以有效處理資料中的異常值並提升分析的穩健性。

圖1. EGRA資料依性別、年級、居住地與年齡分類的四項速度測度箱型圖。圖顯示所有共變數均存在明顯的不平衡效應。
強韌閱讀診斷系統:從模型到實證
在本研究中,於短時間內表現出極低速度的學生,可能因個人緊張或焦慮而導致其真實表現下降。我們將這些資料中總得分最低的10%視為左設限觀測值並進行分析。在此設定之下,任務1至任務4的左設限比例分別為5.98%、12.75%、11.15%、及11.15%。經標準化後反應變數的分佈如圖2對角線的直方圖所示,其中左設限的觀測值以深色區域標示。根據初步觀察,因變數呈現多峰特徵,混合模型能更適切地描述EGRA資料,以反映其內在的異質性。圖2的下三角顯示了預測速度測度的成對散佈圖,其中顏色與符號代表根據最佳擬合的2群FM-MtFAC模型所分類的不同群組。由圖可見,被設限觀測值(以深藍色叉號標示)的預測值皆低於偵測下限,且與未設限單位(以青色圓點標示)同屬於同一群組。少數單位(以洋紅色三角形標示),則被歸入另一群組。透過將極低速度的反應視為左設限觀測並結合有限混合模型分析,本研究成功揭示了EGRA資料中潛在的異質結構,凸顯了混合模型在處理設限且多峰分佈資料時的優勢與適切性。

圖2. EGRA資料的真實值與預測值成對散佈圖,其中洋紅色三角形代表被歸入第2群的個體,其餘個體則歸入第1群。主對角線上為四個反應變數的直方圖,其中紅色虛線表示檢測下限,深藍色區域代表受限反應的真實值。散佈圖中的深藍色十字則為受限反應的預測值。
永續經營跨國合作
本研究為國立中興大學統計學研究所的林宗儀終身特聘教授、國立成功大學統計學系王婉倫教授,以及智利天主教大學(Pontificia Universidad Católica de Chile)統計學系Mauricio Castro 副教授之共同合作成果。該跨國研究團隊已合作逾十年,持續致力於發展創新統計模型以解析多樣類型的複雜資料結構。此研究成果已發表於國際知名期刊《British Journal of Mathematical and Statistical Psychology》,展現了台灣學者在統計方法與教育測量領域的研究深度與貢獻。
參考文獻
[1] RTI International. (2011) Assessing early grade reading skills in Latin America and the Caribbean. United States Agency for International Development.
[2] Wang, W. L., Castro, L. M., Li, H. J. and Lin, T. I. (2024) Mixtures of t factor analyzers with censored responses and external covariates: an application to educational data from Peru. British Journal of Mathematical and Statistical Psychology 77, 316–336
[3] Wang, W. L. and Lin, T. I. (2022) Robust clustering of multiply censored data via mixtures of t factor analyzers. TEST 31, 22–53