AI 時代下的互動形成性評量:以 Quizizz AI 為例

曾嘗試用 AI 生成評量試題的老師可能會發現:ChatGPT 雖能幫上忙,但是生成的題目深度卻不如預期。擔任過多場生成式 AI 融入教學教師研習的吳奇老師分享,實測應用 Quizizz AI 生成試題不僅表現更佳,還能直接將正在瀏覽的網頁內容做成試題!邀請各位老師一起跟著步驟教學試試看。

老師們都很熟悉的數位工具Quizizz推出AI功能,可以上傳教材內容生成適合指定年級學生的試題。圖片提供:吳奇老師

老師們都很熟悉的數位工具Quizizz推出AI功能,可以上傳教材內容生成適合指定年級學生的試題。圖片提供:吳奇老師

本文重點摘要

科技輔助教學型態下的評量觀

測驗評量是教師了解學生學習概況的重要量化指標,如今評量測驗從注重「結果」的「總結性評量」(formative evaluation)逐漸轉變為注重「過程」的「形成性評量」(summative evaluation)。

形成性評量的核心價值在於考察學生在不同學習階段的學習成效,對於提供學生即時學習回饋、教師教學策略調整都相當有價值,傳統課堂的形成性評量多半採用課堂提問、隨堂小考的形式進行。

這樣雖然能達到形成性評量的基本功能,但這些評量結果資料保留麻煩(形成性評量通常有次數多、難度低的特性)、教師執行形成性評量前需要相當的命題準備是相當多的;此外,在疫情線上教學的強烈推力之下,如何在線上教室執行班級經營也成為數位教學的必修課題,在這樣的潮流之下各式各樣的數位教學互動平台魚貫而出,透過結合多媒體構成的觸及反饋機制,形成了對於教師在線上課堂和學生互動的利器。

在疫情趨緩、教學逐漸正常化後,學生的資訊取得型態正在發生改變,由於 Tiktok、Reels 這類短影音平台的興起,從資訊處理觀點來看,這些短影音就是將資訊片段化,讓閱聽者能迅速接收。

對於此一現象的正、負面爭議仍有待討論,不過從目前常見的科技輔助的形成性評量其實就是利用了此一特性,透過「教師選定命題內容-擷取重要觀念作為測驗項目-選擇課堂測驗互動工具平台」這樣的流程形成了科技輔助教學教學的常見型態,因此引入了國外的平台如:KahootWordwall、Quizalize 等 IRS(Interactive Response System)系統平台,又或者是遊戲化(Gamification)的系統平台如:PagamO、Classcraft,可見科技發展、學生學習樣態改變來看,適時採取「科技輔助教學」策略是必須的。

生成式 AI 對於教育生態造成的革命

生成式人工智慧(Generative Artificial Intelligence, GenaI)在 2022 年 OpenAI 發布 ChatGPT 在各大領域早已引起相當大的波瀾,教育領域更是如此,目前文字式生成式人工智慧平台皆本於大型語言模型(Large Language Model, LLM)技術,搭配自然語言處理技術(Natural Language Process, NLP)中的轉換生成與訓練模型(Generative Pre-trained Transformer, GPT),又因為其強大的文字處理能力,基本上一切建立於文字基礎上的工作,生成式人工智慧都使得上力。

教育更是如此,坊間已有許多 GenAI 教學手冊都涵納了 GenAI 在教、學方面的影響與應用,教育部於 2022 年推出《中小學數位教學指引》1.0 版,在 GenAI 崛起之後,在涵納 GenAI 應用之後重新發佈了《中小學數位教學指引》2.0 版,如此可見其影響力

作者從 5 月以來參與研習、擔任研習講師和 AI 相關的已不下 20 場,教育應用技術面,從文字生成到圖片生成;教育應用生態面,從教學備課到行政應用都有,平台更是百家齊放,例如:OpenAI 的 ChatGPT、Google 的 Bard、Microsoft 的 Copilot。

除了這些以聊天機器人為本,更有針對教師備課應用的 AI 生成平台,例如:MagicSchool.ai、Eduaide.ai,這些平台已經出現了 AI 生成試題的模式,而我們常見的形成性評量用的 IRS 平台也出現了結合 AI 生成的功能,筆者此處就以 Quizizz AI 為例和大家分享。

Quizizz AI 的基本操作順序

1. 認識操作介面

左邊欄位是資料管理介面的切換(探索、圖書館(資料建置紀錄)、成績報告、班級、設定等),搜尋欄位是能夠讓教師搜尋科目、內容,還有 Quizizz 平台已經建立的屍體資料庫,下面更有可以參考的測驗「模板」可供教師使用,另外因為 IRS 系統常為了便於使用,因此生成代碼可於測驗之間的互動連結、測驗識別。

Quizizz

Quizizz 介面。圖片提供:吳奇老師

2. AI 生成方式與內容選擇

Quizizz 從生成的類型可以分為生成「試題」、「課程」兩種類型,本篇就著重於討論搭配 AI 生成測驗試題,建構可以用於 IRS 工具的試題。

AI 生成的形式選擇包括「提示詞生成」、「文件生成」、「URL 生成」透過提供教材來源,進而補充原先語言模型資料庫的不足之處,而且提供 Google Form、Google Slides、Excel 試算表等不同格式的匯入,讓老師們在數位互動測驗的製作更方便。

Quizizz AI 生成測驗(圖1)

老師可以運用 Quizizz AI ,上傳教材、文件或任何 URL 網址,讓 AI 生成測驗試題。圖片提供:吳奇老師

3. AI 生成操作介面與細節微調

從前述的「提示詞生成」、「文件生成」、「URL 生成」三種模式之下延伸出的操作介面其實相當簡單,只要在輸入「提示詞」、「年級」、「問題數」之後就可以生成了。不同於一般 AI 命題,Quizizz 會呈現初步的命題框架再行生成,使用者可以先確定框架是否符合自己的命題需求再進行後續的內容生成。

Quizizz AI 生成測驗(圖2)

輸入提示詞,選擇年級、問題數,即可生成測驗問題。圖片提供:吳奇老師

Quizizz AI 生成測驗(圖3)

不同於運用ChatGPT生成題目,Quizizz 會呈現初步的命題框架再行生成。圖片提供:吳奇老師

4. 試題輸出、校正、微調

比起一般的生成式 AI 聊天機器人平台如 ChatGPT,又或是針對教育內容的 AI 平台,如 MagicSchool.ai 對於生成的結果,僅提供簡單的編輯,然而 Quizizz 除了能提供編輯之外更能使用,在左邊欄位能讓使用者輸出多平台、格式,試題編輯後也能為了每一題設定試題施測時間。

Quizizz AI 生成測驗(圖4)

題目生成完成後還能做編輯調整。圖片提供:吳奇老師

5. 試題派發介面

在完成試題微調後,按下「發布」就可以進行試題管理,可以選擇「開始線上實時測驗」、「指派作業」兩種模式,就可以將試題作為課堂即時性的數位互動媒材或是作為學生返家後的線上作業,這些完成的試題都會存儲在「我的圖書館」、並按照派發對象進行「班級」分類,學生在課堂上的表現則可以透過「成績報告」查看。

Quizizz AI 生成測驗(圖5)

微調完成後,就可以指派作業給同學們。圖片提供:吳奇老師

6. Google Chrome 插件:Quizizz 的 Copilot

在生成式 AI 出台之後,大量的應用模式隨之而出,「AI 共駕」(助理)的概念也被提出,Quizizz 的 Google Chrome 插件,就能讓教師將瀏覽網頁時看到適合作為學生延伸學習的素材製作成試題,對學生進行評量,不用如以往需要將網頁上的文章複製後額外改寫,再從改寫的內容抽出施測內容。

生成內容也有兩個模式可以選擇:「試題生成」、「試題短文+延伸問題」,讓教師對於試題編撰、創造更容易。

Quizizz 的 Copilot

新增 Quizizz 的 Google Chrome 擴充功能後,不用複製網頁文章內容,瀏覽網頁時看到適合做成的素材即可生成試題。圖片提供:吳奇老師

Quizizz AI vs. GPT-4:ANI 的使用策略

在人工智慧當中,按照能力可劃分為弱 AI、強 AI、超 AI,就目前市面上任何 AI 產品都僅是 ANI(Artificial Narrow Intelligence)即針對特定人任務而產生的人工智慧,通用性 AGI(Artificial General Intelligence)的發展仍有其努力空間,因此對於目前的人工智慧採用串接(integration)形式,將 GPT 模型整合到特定平台賦予其更明確的任務內容,其表現會遠比在原技術平台的效果來的更好。

作者用「第一次世界大戰的事件因果」作為提示詞,提供給 ChatGPT、Quizizz 兩平台的生成結果做比較,(右圖)為 ChatGPT (GPT-V3.5) 生成結果、(左圖)為 Quizizz 生成結果,可以發現從試題的深度、完善程度,顯然 Quizizz 在試題生成上的表現更佳。

實測用「第一次世界大戰的事件因果」作為提示詞,提供給 ChatGPT、Quizizz 兩平台的生成結果,Quizizz 在試題生成上的表現更佳。圖片提供:吳奇

在生成式 AI 應用於評量中,常會面臨幻覺現象(hallucination)、以及資料庫空缺的問題,從測驗評量的角度而言即可能造成試題缺乏效度、試題品質良莠不齊的問題,因此讓使用者提供外部連結、資料作為資料庫基礎,以及平台本身專門為測驗目的而設計,大大強化了生成式 AI 對於特定工作的專精程度。

Quizizz AI 能讓教育工作者提供了上傳 PDF、DOC 或 PPT 文件,或輸入文本、URL 連結,甚至 YouTube 連結生成相關的測驗問題。這不僅節省了教師的時間、讓試題更貼合教材內容,進而將生成式 AI 的內容結合出既有的 IRS 工具讓教師輕鬆建構符合特定課程需求、學生學習目標的形成性評量。

生成式 AI 時代下教育環境的減法革命

Baidoo-Anu, D., & Ansah, L. O. (2023) 提出了生成式 AI 在教育上面具有相當程度的影響,尤其是在差異化教學(Differentiated Instruction),讓學習者善用和 AI 互動進行學習,減少教師在課堂上的壓力;在備課方面可減少教師進行素材格式轉換、例行內容編撰時的精神消耗,讓教師可更專注於課程編排、學生特性考量的層面。

Quizizz AI 即是展現生成式 AI 對於形成性測驗評量的影響,Quizizz 本身和 Kahoot、Quizlet、Quizalize 等平台,殊途同歸都是將形成性評量結數位多媒體,形成活絡課堂環境的工具。

原先對於教師而言,需要使用這些工具最大的工程不外乎是將教材內容轉換為測驗題目的時間消耗,若教師能減少試題初步構思、佈局的時間,就能有更多時間聚焦在試題細節、評量難度(以應對不同能力程度需求的學生),這些細微參數的進行調整以形成更完善的試題內容,進而達到良好評量學生、調整教學的效果。

在 ChatGPT 紅火時刻、生成式 AI 平台如雨後春筍而出之際,又正逢國家推行「生生用平板」政策,數位教學已構成不可逆趨勢,然而這樣快速的數位革新難免造成部分第一線教師的焦慮包括,「數位科技這麼多要怎麼學?」、「數位科技會不會形成反效果?」、「數位科技會不會造成資安外洩」等種種疑慮。

坦白講,這些問題吳奇老師有沒辦法提出最好的答案,但是吳奇老師在外擔任講師時總會說:「教育科技 SOP:認識、理解、應用」先認識工具、平台了解功能,再理解工具平台在教學設計中的角色,最後應用實際充滿變數的課堂,也和 TPACK 教學法(Technology Pedagogical Content Knowledge)的精神不謀而合,使用科技之不能忘記教學法、學生才是我們的核心目標。

AI 的各類研習講座最愛說:「AI 不會取代人,只會取代不會 AI 的人」,教育就是一個這樣的行業,當教育環境中致使我們案牘勞形的俗務將(正)被 AI 取代,我們應該把這些節省下來的心力回歸的教學、師生溝通之上,這才是AI時代下教育工作者的應有心態!

文獻來源:Baidoo-Anu, D., & Ansah, L. O. (2023). Education in the era of generative artificial intelligence (AI): Understanding the potential benefits of ChatGPT in promoting teaching and learning. Journal of AI, 7(1), 52-62.

延伸閱讀

吳奇 吳奇

吳奇

教師、數位敘事力期刊IG主編

目前在國立台灣師範大學攻讀華語文教學研究所,同時是我國具備華語文教學、中等教師證的國文科教師,主要研究領域為語文教育、認知語言學、教育科技,於今年配合國家數位教學政策、AI興起浪潮,在國內進行了數場GenAI融入教學的教師研習、分享講座。

數位敘事力期刊IG

翻轉教育電子報

訂閱翻轉教育電子報(每週三發送)

每週精選國內外教育報導,提供給關心教育的你

分享