學習分析

透過嵌入幾何驗證基於自然語言的教育數位孿生於 Python 課程

Validation of Natural Language–Based Educational Digital Twins through Embedding Geometry in Python Courses

研討會論文 Y.-C. Chien, C.-C. Yen, and C.-K. Chang* （* 通訊作者） IEEE ICALT 2026

教學問題

教育數位孿生（Educational Digital Twins）旨在超越分數導向的評量，建立更完整的學習者狀態表徵。然而，學習者產生的自然語言是否能形成穩定且可解釋的孿生狀態表徵，仍是未解的研究問題。傳統的常態分佈（bell-curve）分級方式在語意嵌入空間中是否仍然適用，也值得探討。

研究方法

本研究以北台灣某大學 Python 程式設計課程（N = 162）為場域，收集學生透過課程整合 GPT 系統提出的學習相關問題作為語言行為資料。將每位學生的多次提問聚合為單一語言行為單元，透過微調的 Transformer 編碼器搭配注意力感知池化與 L2 正規化嵌入，並以 PCA 與距離統計分析嵌入空間的結構一致性與可分離性。

主要發現

五級常態分佈分級方案導致中間類別嚴重塌縮，嵌入幾何高度重疊，無法形成有效的區辨結構
三級分級方案產生更清晰的組織結構，分離比達 1.107，且驗證行為穩定不塌縮
學習者自然語言確實能形成穩定的數位孿生狀態空間，但前提是標籤粒度需匹配潛在語意幾何
研究證實教育數位孿生的可行性取決於表徵幾何與標籤設計的對齊

對教學的啟示

定義數位孿生狀態時，不應僅依賴傳統的常態分佈分級，而需將狀態粒度與表徵幾何對齊，確保學習到的孿生狀態空間具有可解釋性、穩定性，並可支援後續的教學決策。未來將結合多模態資料（作答軌跡、學習行為、時序信號等）建構更穩健的孿生狀態。

在 Uedu 上的實踐：UeduGPTs 對話分析

本研究直接建構於 Uedu UeduGPTs 的對話資料之上，驗證了利用學生提問的語言行為來建構學習者數位孿生的可行性。研究成果將回饋至 Uedu 的對話分析模組，未來可自動識別學習者的能力層級並提供個人化的學習支援。

前往使用

引用資訊

Y.-C. Chien, C.-C. Yen, and C.-K. Chang, "Validation of Natural Language–Based Educational Digital Twins through Embedding Geometry in Python Courses," in 2026 IEEE International Conference on Advanced Learning Technologies (ICALT), Jul. 2026.

上一篇多模態 VLM 課堂協調：預測學生分心的精確時刻下一篇多模態學習分析中的時序延遲效應：生理—行為特徵化

想做類似研究？

我們提供研究設計諮詢、IRB 支援與資料匯出，讓您的教學實踐也能成為學術研究。

預約討論

--

6

32.3%

140.05

82.02%

62,201

AI 回覆桌面通知

聊天訊息通知

聲音通知

更多設定