Validation of Natural Language–Based Educational Digital Twins through Embedding Geometry in Python Courses
教育數位孿生(Educational Digital Twins)旨在超越分數導向的評量, 建立更完整的學習者狀態表徵。然而,學習者產生的自然語言是否能形成 穩定且可解釋的孿生狀態表徵,仍是未解的研究問題。 傳統的常態分佈(bell-curve)分級方式在語意嵌入空間中是否仍然適用,也值得探討。
本研究以北台灣某大學 Python 程式設計課程(N = 162)為場域, 收集學生透過課程整合 GPT 系統提出的學習相關問題作為語言行為資料。 將每位學生的多次提問聚合為單一語言行為單元, 透過微調的 Transformer 編碼器搭配注意力感知池化與 L2 正規化嵌入, 並以 PCA 與距離統計分析嵌入空間的結構一致性與可分離性。
定義數位孿生狀態時,不應僅依賴傳統的常態分佈分級, 而需將狀態粒度與表徵幾何對齊,確保學習到的孿生狀態空間 具有可解釋性、穩定性,並可支援後續的教學決策。 未來將結合多模態資料(作答軌跡、學習行為、時序信號等)建構更穩健的孿生狀態。
本研究直接建構於 Uedu UeduGPTs 的對話資料之上, 驗證了利用學生提問的語言行為來建構學習者數位孿生的可行性。 研究成果將回饋至 Uedu 的對話分析模組, 未來可自動識別學習者的能力層級並提供個人化的學習支援。
前往使用