LLM 相關三個月內文章 / 第 121 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

現在越來越多人用AI心理治療聊天機器人,但品質還沒被好好評估。作者開發了CAPE評估架構,從8個面向來看這些機器人。實際評測4款熱門GPT聊天機器人後,發現它們在互動、好用度和對話技巧表現不錯,但在治療專業、風險控管和資料透明度都很弱,尤其隱私和防傷害措施很不足。CAPE能幫助大家判斷品質,顯示這些機器人安全和隱私還有很大進步空間。 相關文章 PubMed DOI 推理

這項研究比較ChatGPT和Google Gemini在回答周邊動脈疾病常見問題時的表現。結果顯示,ChatGPT的正確率較高,且沒有明顯錯誤,Gemini則有部分錯誤答案。兩者的回答都偏難讀,不太符合病人衛教建議的閱讀程度。雖然AI能協助病人獲取正確資訊,但內容還需優化,讓病人更容易看懂。未來應加強AI健康資訊的可讀性與實際應用成效。 相關文章 PubMed DOI 推理

這項研究發現,雖然單純用ChatGPT-4修訂醫學會議摘要效果有限,但結合ChatGPT-4建議後再由研究人員編輯,摘要品質明顯提升。特別對經驗不足或語言能力較弱的研究人員幫助最大。不過,ChatGPT-4偶爾會出現事實錯誤,使用時仍需謹慎。 相關文章 PubMed DOI 推理

這篇研究提出「Murder Mystery Agents」架構,把人類常見的輪流發言規則應用在AI代理人對話中。透過在推理解謎遊戲中測試,讓AI能自主決定發言時機,結果顯示這樣能減少對話中斷,提升資訊分享和推理能力,讓多代理人AI對話更自然有效。 相關文章 PubMed DOI 推理

這項研究比較了四款大型語言模型在臂叢神經屍體解剖教學的表現。結果發現,ChatGPT-4o 和 Grok 3.0 在科學正確性和教學指引上最優;DeepSeek 內容簡單易讀但細節不足;Gemini 表現普通。雖然無法取代實際操作,但這些 AI 工具在資源有限時,能有效輔助解剖學教學,對未來外科訓練也有幫助。 相關文章 PubMed DOI 推理

這項研究比較了 OpenAI 的 GPT 和 DeepL 在醫學術語翻譯上的表現,發現兩者品質差不多,沒有明顯差異。不過,部分術語翻得不夠完整,顯示還有改進空間,也需要更多研究來確認結果。 相關文章 PubMed DOI 推理

這篇研究比較伊朗和美國護理博士課程,發現伊朗課程較傳統、彈性低,可能影響學生批判思考與適應力;美國AACN課程則更強調學生中心、問題導向和臨床整合。兩國可互相學習,伊朗可加強協作與科技應用,美國則可提升文化能力訓練,促進護理教育品質提升。 相關文章 PubMed DOI 推理

這項研究發現,牙醫在做根管治療時遇到器械斷裂,常會感到壓力大、害怕後果、信心受挫,甚至出現職業倦怠。這不只影響身心健康,也可能損害名聲和財務。建議加強法律和保險保障、建立安全通報機制、標準化處理流程,並強制知情同意,來協助牙醫面對這類狀況。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT-4o產生的急診醫學選擇題比醫師寫的簡單,考生分數也較高,但兩者的鑑別度和一致性差不多。不過,AI出的題目有較多被認為有問題,顯示在醫學考試用AI題目前,還是要嚴格審查。 相關文章 PubMed DOI 推理

這項研究用LLaMA-3大型語言模型自動擷取眼科門診紀錄中的視力和眼壓資料,結果在最佳矯正視力和眼壓的準確率都超過九成,但未矯正視力的準確率較低,且遇到紀錄不清楚時表現不佳。整體來說,本地大型語言模型有潛力應用於醫療資料擷取,但還需針對不明確紀錄加強改進。 相關文章 PubMed DOI 推理