原始文章

這項研究分析了四種人工智慧大型語言模型(LLMs)對有學習障礙和沒有學習障礙學生的反饋、挫折感、同情心及未來失敗期望的評估。結果顯示,LLMs對有學習障礙的學生表現出較低的挫折感和較高的同情心,且對未來失敗的期望也低於實習教師。特別是ChatGPT4對兩組學生提供了更多正面反饋。整體而言,LLMs可能促進對有學習障礙學生的包容態度,但仍需調整以增強文化和情感的敏感性。 PubMed DOI


站上相關主題文章列表

研究評估大型語言模型對自閉症患者回應的效果,發現醫師回應更準確實用,而LLMs在同理心表現較佳。在將LLMs應用到臨床前,還需進一步研究和改進。 PubMed DOI

這項研究評估了安徽醫科大學醫學生對大型語言模型(LLMs),如ChatGPT的理解與使用情況。調查於2023年12月至2024年1月進行,共發放1,774份問卷,回收有效回應1,718份,回應率達96.84%。 主要發現包括:34.5%的學生使用過LLMs,男性、大三學生及公共衛生管理專業的學生對LLMs理解較好。男性和護理專業學生對LLMs的信任較高,且男性與大三學生在輔助學習中使用LLMs更普遍。大多數學生對LLMs持中立態度,只有3%持悲觀看法。研究指出,性別、年級和專業影響醫學生對LLMs的理解與使用,建議將這些模型整合進醫學教育中以提升教學效果。 PubMed DOI

這項研究探討大型語言模型(LLMs),特別是GPT-4,如何應用於分析課堂對話,以評估教學品質和診斷教育需求。傳統質性分析方法耗時且需專業知識,研究旨在確認LLMs是否能簡化此過程。研究使用中學數學和中文課的數據,將專家手動編碼的結果與GPT-4生成的結果進行比較。結果顯示,GPT-4能顯著節省時間,且編碼一致性高,顯示LLMs在教學評估和教育改進上具潛力。 PubMed DOI

最近大型語言模型(如ChatGPT和Bard)在教育領域的應用引發了對學術論文寫作潛在濫用的擔憂。本研究探討這些模型是否能生成關於醫學生個人經歷和倫理困境的非結構性論文,並檢視其是否能與人類作品區分。 研究團隊收集了47篇學生的原創論文,並利用這些內容生成相同數量的AI論文。分析結果顯示,AI生成的論文在情感和分析思維的語言使用上較學生作品更為頻繁。儘管存在語言特徵的差異,兩個LLMs在反映學生對倫理困境的經歷方面均表現出高度有效性。 PubMed DOI

這項研究探討大型語言模型(LLMs),如ChatGPT和Gemini,在體育生理課程中評分書面作業的效果。研究比較了這些AI模型與人類評分者在使用布魯姆分類法的評分準則下的準確性和可靠性。結果顯示,雖然LLMs有一定的評估能力,但仍未達到人類評分者的水準,人類之間的評分一致性較高。人類與LLM的評分相關性通常為中等到較差,顯示AI在教育評估中的輔助潛力,但也強調了AI技術和教育者學習策略需持續改進。 PubMed DOI

這項初步研究探討了大型語言模型(LLMs),特別是ChatGPT 3.5和ChatGPT-4,在心智理論(ToM)方面的能力,並與自閉症譜系障礙(ASD)及典型發展(TD)個體進行比較。研究發現: 1. 兩個LLMs在理解心理狀態的準確性上高於ASD組,但ChatGPT-3.5在複雜心理狀態上表現不佳。 2. ChatGPT-3.5在情感狀態識別上低於TD個體,尤其是負面情緒,但與ASD組相似。ChatGPT-4有所改善,但仍難以識別悲傷和憤怒。 3. 兩者的對話風格冗長且重複,類似高功能自閉症個體。 研究顯示LLMs在理解心理和情感狀態的潛力及其局限性,對ASD的臨床應用有影響。 PubMed DOI

這篇迷你評論探討生成式人工智慧(GAI)和大型語言模型在滿足學習者認知與情感需求的角色,並強調其實際應用與限制。文章分析了2019至2024年間的實證研究,特別是ChatGPT在教育中的應用。雖然GAI能透過互動學習增強學生參與感,但在促進批判性思維和維持回應準確性方面仍有挑戰,可能讓學習者感到困惑。此外,GAI在定制學習和提供情感支持上也不夠充分。評論呼籲改進教學策略,並對GAI的介入進行仔細評估,以避免對學習造成負面影響。 PubMed DOI

這項研究探討大型語言模型(LLM)如ChatGPT對研究生情感和心理健康的影響。透過對23名大學生的訪談,結果顯示雖然使用者欣賞這些AI工具的功能,但也面臨焦慮、依賴和對未來的悲觀等負面影響。研究指出,使用LLM的好處與情感成本並存,顯示對學生心理健康的影響具有「雙刃劍」的特性。 PubMed DOI

這項研究評估了四個大型語言模型(LLMs)在心理健康診斷和治療的能力,包括Gemini 2.0、Claude 3.5、ChatGPT-3.5和ChatGPT-4。主要發現顯示,ChatGPT-4在診斷憂鬱症和PTSD方面優於人類專業人士,但在複雜案例如早期精神分裂症的準確率僅55%。LLMs提供的治療建議較為多樣,但專業人士則偏好具體的精神科諮詢。總體來看,雖然LLMs能協助診斷和治療計畫,但在複雜情況下仍需專業監督。 PubMed DOI

這項研究評估了三個大型語言模型(LLMs)—ChatGPT-4o、Claude 3.5 Sonnet 和 Gemini 1.5 Pro—在自殺意念反應評估的能力。結果顯示,這三個模型的反應評價普遍比專家自殺學者更適當,尤其是ChatGPT的評分差異最大。異常值分析發現,Gemini的偏差比例最高。整體來看,ChatGPT的表現相當於碩士級輔導員,Claude超過受訓心理健康專業人士,而Gemini則類似未受訓的學校工作人員。這顯示LLMs在評估反應時可能有偏向,但部分模型的表現已達到或超過專業水平。 PubMed DOI