10. The Rasch Model Applied across the Human Sciences

(前面內容暫無翻譯)

我們真的可以結合SEM和Rasch模型嗎?

儘管如此,與常用軟件包(如MPlus和AMOS)實現的結構方程模型相比,PLS模型仍然相對較少使用。這兩種方法關注的方面不同,但相互補充而非矛盾。廣義而言,PLS更注重通過最大化結果變量中解釋的變異量來進行預測,主要是探索性的和生成模型的。另一方面,SEM基於一個廣義的因子分析框架,同時研究試題和潛變量之間以及潛變量之間的關係。它更強調模型和理論檢驗,或通過尋求重現試題之間觀察到的協方差來比較替代模型。例如,Hair、Matthews、Matthews和Sarstedt(2017)或Rigdon、Sarstedt和Ringle(2017)對兩種方法進行了更詳細的比較。由於SEM仍然是最常用的方法,許多讀者更熟悉這種方法,他們可能會問我們是否真的可以結合SEM和Rasch模型。這可能看起來是一個犯了原則錯誤的問題,因為在Rasch測量和SEM的支持者之間似乎很少有什麼能夠建立橋梁。正如當Rasch測量殘差的PCA第一次被吹捧時一樣,它受到了質疑。但這確實是一個合理的問題。Rasch或試題反應理論與SEM之間的嚴格區分相當人為。這是因為SEM提供了一個通用的因子分析框架,不僅可以建模連續變量,還可以建模二元和有序類別變量(例如,Muthén,1984),其中包括與Rasch模型相同的邏輯鏈接函數。因此,它還可以用於指定Rasch(或IRT)模型作為驗證性因子分析模型。關於Rasch分析本身和基於SEM的Rasch分析之間的技術差異,例如分布假設等,詳見附錄C的註釋。 

將Rasch模型建模為驗證性因素分析(CFA)可能有一些優點。它使我們能夠在SEM框架內測試Rasch模型,並同時將潛在的潛在變量與其他潛在變量或標準相關聯,我們可能希望使用Rasch或IRT縮放的測試或問卷來進行預測。換句話說,它是SEM的一部分,涉及模型測試(即,將Rasch模型指定和測試為CFA),以及SEM的後續部分,該部分研究了潛在的潛在變量與觀察到的試題反應之間的關係。例如,研究人員可能會對8歲兒童中“工作記憶”潛在變量進行評估,並使用一組二分試題來預測12歲時使用另一組二分試題測量的“普通智力”(G)潛在變量的程度。當然,我們可以對每個測試進行Rasch縮放,估計相應的人員參數,並使用簡單線性回歸將12歲的測試表現回歸到8歲時的表現。然而,需要認識到,人員參數是從觀察到的總分中估計出來的,因此不是無誤差的,而是由於測量的試題反應中存在交互個體差異的潛在變量和隨機測量誤差的系統部分和非系統部分組成(請參閱Kreiner和Christensen,2013,進一步說明)。 

隨機誤差是因為很多其他變數可能干擾測試結果,而這些變數通常不在研究者的控制範圍之內,這些變數包括猜測、粗心、誤讀問題或參與者感覺不適等。這種錯誤通常不會在後續的測試中再次發生,因此是隨機的,且難以預測。解決變數中的測量誤差問題非常重要,因為它會嚴重偏誤回歸估計或相關性(例如,Fuller,2009;Bollen,1989),進而導致對兩個或多個潛在變數之間的關係得出錯誤的結論。雖然使用多維隨機係數多項式模型(Adams、Wilson和Wang,1997)也可以使相關性減弱,但基於SEM的方法提供了更大的靈活性,因為可以指定更複雜的潛在回歸模型。例如,可以使用SEM直接、間接和交互效應來指定潛在變數之間的回歸模型,並得到經調節的回歸係數。 

進一步來說,研究人員可能會觀察到工作記憶和G之間的個人參數的標準化回歸權重為0.35。研究人員可能會得出結論,即潛在變量“工作記憶”與G之間的關係很弱。但是,工作記憶和G的測試可能都受到測量誤差的影響 - 其中工作記憶的測試信度為0.60,而G的測試信度為0.70。那麼,通常在理論上感興趣的問題是“如果我們糾正了這兩個變量中的測量誤差,回歸權重會是多少?”我們可以使用SEM來回答這個問題,因為它使用潛在變量(即因子)來解釋測量誤差。這些潛在變量僅包含因個體之間的系統性差異部分,不包含測量誤差。因此,潛在變量之間的關係不受測量誤差的影響。因此,在我們上面的例子中,我們會發現,在“工作記憶”和“G”之間的潛在變量的回歸權重估計值為0.54。我們不能再稱之為“弱”,並且可能會對工作記憶和G之間的關係得出完全不同的結論。儘管有這些優點,但我們必須承認,Muthén(1984)的方法主要應用於IRT模型,例如2-PL或Samejima模型(例如,Svicher、Cosci、Giannini、Pistelli和Fagerström,2018;Titman、Lancaster和Colver,2016)。這是因為確認性因素分析方法來測試等斜率要求非常嚴格(即檢測違反該要求的功率很高),並且通常會拒絕Rasch模型。Rasch模型的支持者只能使用路徑分析或PLS(偏最小二乘)方法。 稍後我們將在附錄 C 中討論單一維度和模型適配度的問題,我們將演示如何使用 CFA 測試 Rasch 模型中斜率恆定的假設以及從中學到什麼。 

結論

即使是在Rasch量測研究增長的最粗略估計(圖10.8和10.9)中,自本世紀開始,增長趨勢也非常顯著。對本教材前三版的引用(圖10.8)現在每年已經超過600次,是十五年前引用數的六倍。提到Rasch模型的研究(圖10.9)增加了約四倍,自2001年至2007年增加了一倍,之後再次翻倍(2007年至2013年),並於2019年達到了超過16,000篇。

在相同時期,跨研究領域的全面調查將顯示,研究報告數量的增長伴隨著研究主題多樣性的增加。 

圖 10.8 套用 Rasch 模型的引用次數(2001-2019) 

圖10.9 引用包含 "Rasch Model" (2001-2007-2013-2019)