LLM 相關三個月內文章 / 第 42 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

Prompt engineering對舊版語言模型提升醫學考試表現很有幫助,但對新版(如GPT-4o)幾乎沒影響,因為新模型本來就很強。未來重點應該放在選對模型和如何把AI聰明地融入醫學教育,而不是只調整prompt。 相關文章 PubMed DOI 推理

這項研究用AI結合ChatGPT、WhatsApp和CRM,幫助腎臟和肝臟移植病人及捐贈者衛教。AI回答1,281個問題,準確度和安全性都很高,病患滿意度也高達99.5%。系統在手術相關問題表現特別好,但還需要進一步研究來提升準確性、處理倫理問題,並擴大AI在臨床的應用。 相關文章 PubMed DOI 推理

在兒科知情同意上,LLMs能用孩子聽得懂的方式解釋醫療資訊,也能幫助家長了解細節,提升病童自主權並促進家庭討論。但LLMs是否真能支持自主性、避免誤導,還有倫理疑慮。建議LLMs僅作為輔助,不能取代醫護人員的人性關懷與專業判斷。 相關文章 PubMed DOI 推理

2025年英國調查發現,多數家庭醫師對生成式AI經驗有限,普遍缺乏相關訓練,對AI有疑慮也感到焦慮。大家認為AI適合做文件紀錄,但不適合臨床判斷。雖然不少醫師看好AI潛力,但知識和訓練不足是最大障礙。研究也提醒,基層醫療很需要更多AI教育和研究。 相關文章 PubMed DOI 推理

這項研究比較四款主流AI聊天機器人回答頭頸癌症狀問題的品質與可讀性,發現Microsoft Copilot表現最佳,Open Evidence最差。不同平台差異明顯,顯示AI健康資訊仍需加強驗證與監督,才能確保病人獲得正確、易懂的資訊。這屬於等級4證據。 相關文章 PubMed DOI 推理

這項研究評估 AI 語言模型在新加坡基層診所分類病人申訴的表現,發現 GPT-4o mini 和 Claude 3.5 Sonnet 準確度比 GPT-3.5 turbo 好。常見申訴有等太久、員工態度差和預約問題。結果顯示 LLMs 能提升申訴分析效率,但還需要再優化才能更精準。 相關文章 PubMed DOI 推理

這項研究發現,GPT-4o 在醫學院簡答題批改上,和老師的分數差異大多在±5%以內,準確度很高。AI 對記憶、應用、分析題目特別精準,但理解和評估題型就比較弱。遇到難題時,AI 和老師的評分落差也會變大。建議 AI 批改還是要搭配老師一起使用,尤其是複雜題目。 相關文章 PubMed DOI 推理

將GenAI和LLM導入無線接取網路(RAN),能大幅提升6G網路的自動化與智慧化。不過,要真正發揮效益,還需建立標準化框架、代理架構、工具整合及效能評估等。研究呼籲加強相關標準與驗證,推動AI驅動的網路自動化。 相關文章 PubMed DOI 推理

這篇系統性回顧發現,生成式AI在自閉症診斷和情緒辨識等方面有潛力提升照護品質,但目前研究數量少、樣本有限且缺乏標準化,還有倫理疑慮。未來需加強驗證和透明度,才能安全應用於臨床。 相關文章 PubMed DOI 推理

TL;DR: 這篇研究利用大型語言模型(LLMs)從文獻中自動擷取植物代謝相關資料,像是酵素-產物和化合物-物種配對,還能把表格圖片轉成可用資料。經過不同提示設計和模型測試,結果顯示這方法準確率不錯,漏掉的資料也比以前少。不過,專業知識還是很重要,不能完全靠AI。 相關文章 PubMed DOI 推理