LLM 相關三個月內文章 / 第 10 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究發現,護理學生擬定的護理計畫整體表現比 ChatGPT 好,特別是在診斷正確性上。不過,ChatGPT 在設定護理目標和介入措施方面表現較佳。兩者的資訊品質都屬中等。ChatGPT 有潛力成為護理教育的輔助工具,但還需要更多研究來確認其臨床應用成效。 相關文章 PubMed DOI 推理

多數影片摘要只挑重點,內容常常跳接、不順。這篇論文提出 LS-CAN,用語言連貫性來挑片段,讓摘要更流暢好懂。它用神經網路分析句子主詞、動作等,評估連結度,還結合大型語言模型提升標註品質,效果比傳統方法更好。 相關文章 PubMed DOI 推理

生物醫學關係抽取對一般大型語言模型來說很有挑戰性,表現通常不如專門方法。作者提出多任務指令微調框架,並用新資料集REInstruct訓練LLM,推出開源REaMA模型(7B和13B參數),在七個BioRE資料集上表現優異,甚至超越以往最佳。結合指令微調和chain-of-thought推理後,效果更好。程式碼和模型可在GitHub下載。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT-3.5 在牙髓治療是非題的答題準確率最高(80%),優於 ChatGPT-4、Gemini 1.5 Pro 和 Gemini 1.5 Flash。不過,所有 AI 聊天機器人的答案和專家共識的吻合度都偏低。研究建議,臨床決策時不能只靠 AI,未來還需要更深入的研究來驗證其可靠性。 相關文章 PubMed DOI 推理

這項研究發現,主治醫師結合GPT協助撰寫的手術紀錄,品質和認可度最高;單獨用GPT雖然最快,但正確性較差。AI輔助能加快撰寫速度,結合專業醫師與GPT能產生最佳手術紀錄,提升效率與一致性。 相關文章 PubMed DOI 推理

AI和大型語言模型正快速影響醫學教育,相關研究數量大增。美國、英國、中國是主要貢獻國,JMIR Medical Education等期刊領先。現有研究多聚焦ChatGPT、護理教育、醫學考試和倫理,但臨床推理、大學部教育、虛擬實境等還有待深入。整體來說,這領域還在發展,未來研究空間很大。 相關文章 PubMed DOI 推理

這項研究比較 ChatGPT 4.0、4.5 和 DeepSeek V3 在四種醫療情境下依臨床指引給建議的能力。ChatGPT 4.5 表現最好(61.9%符合指引),心理健康領域分數高於營養領域。醫師式提問通常能提升分數,但營養領域例外。研究也提出新的評分系統,發現 LLM 雖能快速產生符合指引的照護計畫,但內容偏通用,缺乏個人化。 相關文章 PubMed DOI 推理

這項研究發現,經過監督式微調的Llama-3大型語言模型,在偵測ICU病歷中對物質使用障礙患者的污名化語言上,準確率超過97%,甚至比人工標註還細膩。這些模型不只準確,還能說明判斷依據,未來有助於提升臨床文件的用語品質,減少污名化現象。 相關文章 PubMed DOI 推理

這項研究開發出一套用大型語言模型(像GPT-4o)自動評分醫師在前列腺癌諮詢時,溝通風險和權衡的表現。結果顯示,這方法評分準確度高(F1分數85–92),和人工標註差不多,還比傳統模型好。這技術未來可用來提升醫病溝通品質,對癌症照護和其他醫療領域都很有幫助。 相關文章 PubMed DOI 推理

這項研究發現,開源大型語言模型(LLMs)如果沒經過微調,偵測西班牙文臨床紀錄中的精神科症狀表現很差,但經過微調後,準確度大幅提升,甚至比傳統NLP方法更好。團隊還建立了保障隱私的合成資料集,並推出高準確率的「Mistral-small-psych」模型,泛用性也不錯。這證明針對醫療任務微調LLMs很重要,對西班牙語精神科研究很有幫助。 相關文章 PubMed DOI 推理