LLM 相關三個月內文章 / 第 75 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這篇統合分析發現,ChatGPT在皮膚科專科考題的答對率約七成,GPT-4.0表現比GPT-3.5好。不過,研究結果差異大,而且多只針對英文考題,應用在臨床或其他教育場合還有限。未來還需要更多研究來釐清影響表現的因素。 相關文章 PubMed DOI 推理

這份研究發現,台灣學校護理師普遍用ChatGPT查資料和做衛教教材,覺得AI能提升效率,但也擔心準確性、倫理和隱私問題。她們希望有更多實作型訓練,學會下指令和操作AI,並需要明確指引,才能安全有效地把AI用在工作上。 相關文章 PubMed DOI 推理

這項研究發現,GPT-4o 能準確分辨缺血性和出血性中風,準確率高達98%。但在細分缺血性中風的亞型時,表現就不太穩定,敏感度落在40%到95%之間。整體來說,GPT-4o 在中風大分類上很有用,但在細分類型時還有進步空間。 相關文章 PubMed DOI 推理

這篇研究提出SHREC框架,把輕量級LLM整合進EHR分析流程,自動化找特定病人族群。測試三種LLM後發現,像Mistral這類模型在醫療分類和表現型分析上表現優異,準確率和特異性都很高。LLM能減少人工審查負擔,且能彈性適應新任務。未來建議加強與生醫資料整合、理解LLM推理,以及提升生成式模型表現。 相關文章 PubMed 推理

經過微調的 BioClinicalBERT 模型,能準確又有效地從法醫死亡報告中分類特定藥物涉入情形,比傳統方法和一般語言模型更快、更可靠,有效提升藥物過量監測效率,也解決了手動 ICD-10 編碼常見的延遲和資訊遺漏問題。 相關文章 PubMed 推理

Assay2Mol 是一套用大型語言模型打造的工具,能從生化檢測資料庫的文字資訊,產生新藥物分子,幫助藥物開發。它會找出和新標的物相似的檢測資料,生成比只靠蛋白質結構方法更容易合成、效果更好的候選分子。 相關文章 PubMed 推理

中國推動共享決策時,受限於醫療資源不均、知識落差、文化障礙等問題,執行上也有時間壓力、病患參與度低及缺乏標準工具等困難。大型語言模型雖能協助溝通與資訊整合,但在地化與中醫知識仍待加強。未來應強化知識整合與模型表達,促進SDM發展,提升醫療品質。 相關文章 PubMed DOI 推理

最新研究發現,用 GPT-4o 產生的阿拉伯語 BBC 節目字幕,觀眾閱讀時比起專業人工翻譯字幕更吃力,不但花更多時間、眼動次數也增加,注意力更集中,尤其英文能力高的人感受最明顯。雖然 AI 字幕表面流暢,實際上卻讓觀看變難,顯示人工審核還是很重要。 相關文章 PubMed DOI 推理

這項研究發現,GPT-4(ChatGPT)在2023年手外科認證考試中,不管有沒有先看過考古題,表現都差不多,答對率分別是67%和71%,差異不大。雖然它能通過考試,也能處理骨科問題,但事先訓練並沒有明顯幫助。未來,像GPT-4這類AI有機會成為考試準備的輔助工具。 相關文章 PubMed DOI 推理

這項研究比較四款大型語言模型在土耳其牙科專科考試解剖題的表現,ChatGPT-4o 正確率最高(98.6%),其他三款為 89.2%。Gemini 回答最快,DeepSeek 答案最精簡,Gemini 最詳細。各模型在正確率、速度和答案長度上都有明顯差異。ChatGPT-4o 表現突出,顯示對牙醫教育很有幫助,未來可研究如何整合進教學系統。 相關文章 PubMed DOI 推理