原始文章

年長者常有聽懂語音的困難,但現有測驗不夠貼近生活情境,也多只用單一語言。這項研究用大型語言模型自動產生和評分故事型語音理解測驗,涵蓋11種語言,並能準確反映記憶表現。這種方法更貼近真實生活,未來在臨床上很有幫助。 PubMed DOI


站上相關主題文章列表

研究探討了如何運用大型語言模型(LLMs)在失語症研究中的應用。研究人員分析LLMs的語言指標,以改善失語症的診斷和評估。研究結果顯示,LLMs能有效檢測失語症、提高亞型分類的準確性,並捕捉語法缺陷。整合LLMs到自然語言處理流程中,有助於增強對失語症等語言障礙的模型。 PubMed DOI

這篇論文探討大型語言模型(LLMs),如ChatGPT,在癡呆症護理和研究中的應用潛力。文章介紹了LLMs的特性、能力與限制,並討論其在護理中的實際考量,例如透過手機應用程式使用。LLMs可增進對癡呆症的理解、診斷和治療,透過有意義的對話和個性化支持來改善病人護理。 LLMs的好處包括提升社交互動、改善認知功能和情緒福祉,並減輕照護者負擔。不過,部署LLMs也引發隱私和倫理等問題。問卷調查顯示,癡呆症患者及支持者對使用LLMs的看法普遍正面,但仍擔心偏見和數據隱私。總體而言,這篇評論強調了LLMs在癡呆症護理中的潛力,並呼籲進一步研究。 PubMed DOI

這項研究探討大型語言模型(LLMs)在健康心理學中如何增強健康評估,旨在克服傳統統計和機器學習方法的限制。傳統方法因線性評分而準確性不足,而機器學習則在可解釋性和數據需求上有挑戰。研究提出的ScaleLLM利用LLMs的自然語言理解能力,提供健康量表的專家評估。實驗結果顯示,ScaleLLM在身心健康評估的準確性和可解釋性上都有所提升,成為該領域的一個有前景的工具。 PubMed DOI

這篇論文探討了傳統大型語言評估的限制,特別是在聽力和口語方面。聽力評估常無法真實反映互動能力,而口語則受限於任務格式。雖然自動化評估有潛力,但仍面臨挑戰。論文提出利用大型語言模型來增強自動化題目生成,創造更複雜的評估內容。具體而言,為Duolingo英語測試開發的互動聽力任務能更真實地評估考生的對話能力。研究顯示,這種方法有效且能改善語言測試中的互動能力評估。 PubMed DOI

認知障礙是全球健康的重要議題,急需早期檢測與介入。傳統診斷方法主觀且成本高,資源不足地區更難取得。我們在INTERSPEECH 2024 TAUKADIAL挑戰中,針對169名英語和中文使用者,自動檢測輕度認知障礙(MCI)並預測認知分數。利用Whisper語音模型提取語音嵌入,並採用集成模型,我們在MCI分類中達到81.83%的召回率,認知分數預測則有1.196的均方根誤差,分別排名第二和第一。研究顯示,語言特有的細微差別對準確預測認知障礙至關重要,展現了在多語言環境中進行非侵入性評估的潛力。 PubMed DOI

這項研究探討如何利用大型語言模型(LLMs)來進行大規模的人類記憶實驗,特別是針對自然敘事的分析。研究發現,隨著敘事長度增加,記憶表現會改善,但參與者常常只會總結長敘事,而非回憶具體細節。當敘事順序被打亂時,回憶表現顯著下降,但識別表現穩定,顯示參與者仍能根據理解重建故事。研究還利用LLM生成的文本嵌入來測量敘事的語義相似度,與回憶可能性有強相關性,顯示LLMs在記憶研究中的潛力。 PubMed DOI

這項研究探討了利用大型語言模型(LLMs)來創建個性化的語言理解測試(AI-BVCTs),以評估語言智力的可行性,並與傳統的韋克斯勒成人智力量表(WAIS-III)進行比較。八位講希伯來語的參與者完成了兩種測試,結果顯示AI-BVCT的得分與WAIS-III的語言理解指數(VCI)有很強的一致性,且兩者之間沒有顯著差異。研究指出,LLMs可能提升認知評估的可及性與經濟性,但也需注意隱私及對AI的依賴等倫理問題,並呼籲進行更大規模的研究。 PubMed DOI

這項研究探討了如何有效測量失語症患者的溝通變化,使用了簡短的交易成功評估(BATS)和故事重述的自動化分析。研究比較了三種大型語言模型(GPT-4、GPT-4o 和 Llama-3-70B)在評分故事重述主要概念的表現,並與人類評分者進行對比。結果顯示,LLM的評分與人類評分高度相關,顯示這些模型能可靠評估故事重述。研究建議,自動化工具可減輕臨床評分負擔,並改變失語症介入和研究的方法。 PubMed DOI

研究發現,Llama-2-70b-chat 和 GPT-3.5 能生成符合年齡、合理的遺傳疾病病例描述和醫病對話,但治療計畫常常不完整或有誤。這顯示大型語言模型在臨床決策應用上,還有不少限制和改進空間。 PubMed DOI

大型語言模型常會產生看似正確但其實錯誤的回答,這跟人類接受性失語症很像。研究發現,LLMs的內部運作和失語症患者大腦的資訊處理方式很相似,特別是在狀態轉換和停留時間上。這種分析方法未來有機會幫助改進LLMs,也可能應用在失語症診斷上。 PubMed DOI