LLM 相關三個月內文章 / 第 107 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究發現,讓三年級醫學生用 ChatGPT 3.5 當虛擬病人練習問診,不但能提升同理心技巧,也讓學生感覺更有自主性。ChatGPT 能給出情緒線索和挑戰,學生多能適當回應。結果顯示,ChatGPT 可有效補充傳統訓練,建議醫學院可納入教學。 相關文章 PubMed DOI 推理

**重點摘要(繁體中文):** 這項研究發現,GPT-4o 這個大型語言模型,能有效評估醫學生在病例討論中的表現,和專家評分者的結果高度一致。針對評分上的差異,研究團隊也透過校準來解決,顯示未來 LLMs 有機會協助醫學教育中學生表現的評量。 相關文章 PubMed DOI 推理

大型語言模型在醫學研究很有潛力,但因架構和運算限制,無法保證完全正確。即使用進階提示或檢索增強生成,也無法徹底解決這些問題。LLMs 最適合用在人類能驗證結果的情境。醫學領域應謹慎選擇工具、加強人類監督並嚴格驗證,才能確保科學正確性。 相關文章 PubMed DOI 推理

這項研究比較了四款大型語言模型在用 AO 分類系統判斷 CT 報告骨折類型的表現。ChatGPT-4o 和 AmbossGPT 準確率最高(約 74%),在辨識骨骼種類上都很準(90–99%),但在細分類骨折時準確率較低(71–77%)。雖然 LLMs 有助於放射科醫師,尤其在忙碌或資源有限時,但臨床應用前還需更多驗證與改進。 相關文章 PubMed DOI 推理

臨床決策用大型語言模型時,缺乏標準審核方式是大問題。作者提出五步驟審核框架,包含利害關係人參與、模型校準和情境測試,並提供工具和範例。隨著法規趨嚴,審查模型輸出比內部參數更能確保醫療AI負責任應用。 相關文章 PubMed DOI 推理

本研究開發了一套全自動單細胞樣本操作平台,結合大型語言模型和物件偵測技術,搭配數位微流控晶片。平台樣本產生速率提升25%,辨識率高達98%,並首創三分類偵測法,能更精準分辨細胞與油泡,尤其在液滴邊緣表現更佳。這也是首次將LLMs導入自動化單細胞樣本流程,推動單細胞分析自動化發展。 相關文章 PubMed DOI 推理

非英語照顧者和兒科醫療人員認為,AI能幫忙醫療翻譯和口譯,但擔心準確度、隱私和同理心不足。他們願意把AI當輔助,而非完全取代真人口譯,特別是在即時翻譯和便利性上。AI工具要普及,必須簡單好用、經過驗證、大家都能用,同時還是要持續投資真人語言服務。 相關文章 PubMed DOI 推理

這項針對50部YouTube影片的研究發現,44%捐贈者所生者(DCP)影片表達正面情緒,28%負面,24%混合,4%中立。用ChatGPT分析的結果和人工審查者高度一致,顯示DCP在影片中的態度整體偏正面。 相關文章 PubMed DOI 推理

研究發現,ChatGPT 4.0在回答巴雷特食道相關問題時,內容正確又完整,甚至比醫師的回覆更受病患青睞,覺得更有品質和同理心。這顯示ChatGPT 4.0有機會成為病患獲取巴雷特食道資訊的好幫手。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT-4 在巴西腎臟科住院醫師考題的表現明顯優於 3.5,正確率高出許多,尤其在非圖片題更突出。不過,研究有圖片題少、題目較舊等限制。整體來看,ChatGPT-4 在腎臟科推理能力較強,但還需要更多研究來確認其臨床應用的實際效益。 相關文章 PubMed DOI 推理