LLM 相關三個月內文章 / 第 84 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究探討生成性人工智慧(GenAI)在心理治療中的應用,特別是透過敘事治療和認知行為治療的外化技術。研究者開發了兩個AI工具:VIVI,用於生成代表病人內心經驗的圖像;DIVI,促進對話角色扮演以互動。這些工具作為「人工第三者」,增強治療師與病人之間的關係,但也面臨同理心缺失和文化偏見等挑戰。為解決這些問題,作者提出了SAFE-AI協議,提供負責任使用AI的指導方針,並鼓勵未來研究評估其在不同族群和環境中的有效性及倫理影響。 相關文章 PubMed DOI 推理

這篇論文介紹了一個新工具 SEMbeddings,結合微調的嵌入模型與潛在測量模型,能在實際數據收集前評估項目反應數據的適配度。作者將其應用於 VIA-IS-P 問卷,分析了 31,697 名參與者的回應,結果顯示項目嵌入的餘弦相似度與實證相關性有顯著關聯 (r = 0.67)。論文也提到,傳統適配指標可能不夠準確,但修正指標能提供潛在不適配的見解,對於問卷開發有幫助。隨著大型語言模型的進步,這些方法有望提升新問卷的開發效率。 相關文章 PubMed DOI 推理

在數位心理健康領域,聊天機器人的使用越來越普遍,能有效解決心理健康專業人員不足的問題,並提供可及的支持。研究分析了2015至2024年間的261篇相關文章,發現這方面的研究每年增長46.19%。美國在貢獻上居首,其次是英國、澳洲、中國和法國。法國的國家科學研究中心是最具影響力的機構,而《醫學網路研究期刊》則是主要的出版來源。研究突顯了聊天機器人在心理健康支持中的潛力,並提供了對專業人員和開發者的寶貴見解。 相關文章 PubMed DOI 推理

這項研究探討了患者與GPT-4驅動的聊天機器人在泌尿科諮詢中的互動。從2024年2月到7月,共招募300名患者,評估聊天機器人提供的醫療資訊質量。292名參與者完成了研究,結果顯示大多數患者認為聊天機器人的回應有用且易懂,但人類醫生的回答評價較高。53%的參與者偏好大型語言模型的問答能力。研究指出,這類模型可增強患者教育,並減輕醫療提供者的時間壓力。限制包括潛在的偏見和抽樣問題。 相關文章 PubMed DOI 推理

這項研究提出了一種創新的教育角色扮演方式,利用基於GPT-4的AI機器人模擬健康相關的病史訪談。由大學講師和AI專家共同開發,讓不同健康專業的學生能與虛擬病人進行複雜對話,取代傳統的角色扮演。調查結果顯示,超過80%的學生認為虛擬病人的專業性和準確性良好,並且更喜歡這種AI訓練方式,認為其沉浸感和互動性優於傳統方法,顯示AI在教育中的潛力。 相關文章 PubMed DOI 推理

這項研究評估了ChatGPT和Gemini在根據歐洲放射學會iGuide解釋成人腦部CT轉診的表現。結果顯示,歐洲影像轉診指導方針的採用不佳,導致許多不必要的CT掃描。雖然ChatGPT在分析美國指導方針時表現良好,但在這項研究中,兩個聊天機器人在辯護CT轉診方面的表現有限,特別是對模糊案例。研究建議,雖然聊天機器人有潛力,但仍需改進以應對真實世界的挑戰。自訂預測模型的表現則顯著優於聊天機器人。 相關文章 PubMed DOI 推理

這項研究評估了大型語言模型(LLMs),如ChatGPT和Google Bard,對美學整形手術的回應可靠性,並與經驗豐富的外科醫生的見解進行比較。研究分析了三十位患者對皮膚填充劑、肉毒桿菌注射和眼瞼手術等問題的回應。十三位外科醫生根據可及性、準確性和實用性評估了LLM的回應。結果顯示,雖然聊天機器人的回應通常清晰且準確,但缺乏來源透明度限制了其可信度。研究建議在依賴LLMs作為主要信息來源時需謹慎,並呼籲進一步研究以增強其在醫療保健中的可靠性。 相關文章 PubMed DOI 推理

這項研究評估了兩個人工智慧平台,ChatGPT-4 和 Claude 2,對前庭神經瘤管理資訊的品質。由19位側顱底外科醫生組成的評估小組使用醫療人工智慧品質評估問卷(QAMAI)來檢視36個問題的回答。結果顯示,ChatGPT-4在38.9%的問題上表現優於Claude 2,而Claude 2僅在5.6%的問題上得分較高。雖然ChatGPT-4在大多數方面表現較佳,但兩者在提供準確資訊上仍有困難,顯示患者使用這些工具時面臨錯誤資訊的風險。 相關文章 PubMed DOI 推理

這篇論文探討如何利用自然語言處理(NLP)評估青少年聊天輔導服務的滿意度。研究分析了2,609名年輕用戶的數據和約140,000條訊息,訓練了兩種分類器:極端梯度提升(XGBoost)和基於變壓器的模型。XGBoost的表現較佳,AUC得分為0.69,而Longformer為0.68。研究發現,認為諮詢有幫助的用戶通常表達滿意,而拒絕提供的練習則顯示無幫助。雖然預測性能中等,作者建議進行更多隨機試驗以評估服務改進的影響,並強調簡單模型與複雜模型比較的重要性。 相關文章 PubMed DOI 推理

這篇文章探討了一個醫療聊天機器人的框架,目的是提升放射治療的教育。重點在於準確性、可靠性、隱私和倫理等關鍵因素,並展望未來的創新。文章回顧了現有研究,評估了聊天機器人的表現,指出內容準確性、偏見及與現有系統整合的挑戰。分析顯示,自然語言處理、個性化學習和沉浸式技術有進步潛力。若能在倫理和可靠性基礎上開發,這類聊天機器人將可能成為未來醫療教育的重要工具。 相關文章 PubMed DOI 推理