LLM 相關三個月內文章 / 第 18 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究發現,主治醫師結合GPT協助撰寫的手術紀錄,品質和認可度最高;單獨用GPT雖然最快,但正確性較差。AI輔助能加快撰寫速度,結合專業醫師與GPT能產生最佳手術紀錄,提升效率與一致性。 相關文章 PubMed DOI 推理

AI和大型語言模型正快速影響醫學教育,相關研究數量大增。美國、英國、中國是主要貢獻國,JMIR Medical Education等期刊領先。現有研究多聚焦ChatGPT、護理教育、醫學考試和倫理,但臨床推理、大學部教育、虛擬實境等還有待深入。整體來說,這領域還在發展,未來研究空間很大。 相關文章 PubMed DOI 推理

這項研究比較 ChatGPT 4.0、4.5 和 DeepSeek V3 在四種醫療情境下依臨床指引給建議的能力。ChatGPT 4.5 表現最好(61.9%符合指引),心理健康領域分數高於營養領域。醫師式提問通常能提升分數,但營養領域例外。研究也提出新的評分系統,發現 LLM 雖能快速產生符合指引的照護計畫,但內容偏通用,缺乏個人化。 相關文章 PubMed DOI 推理

這項研究發現,經過監督式微調的Llama-3大型語言模型,在偵測ICU病歷中對物質使用障礙患者的污名化語言上,準確率超過97%,甚至比人工標註還細膩。這些模型不只準確,還能說明判斷依據,未來有助於提升臨床文件的用語品質,減少污名化現象。 相關文章 PubMed DOI 推理

這項研究開發出一套用大型語言模型(像GPT-4o)自動評分醫師在前列腺癌諮詢時,溝通風險和權衡的表現。結果顯示,這方法評分準確度高(F1分數85–92),和人工標註差不多,還比傳統模型好。這技術未來可用來提升醫病溝通品質,對癌症照護和其他醫療領域都很有幫助。 相關文章 PubMed DOI 推理

這項研究發現,開源大型語言模型(LLMs)如果沒經過微調,偵測西班牙文臨床紀錄中的精神科症狀表現很差,但經過微調後,準確度大幅提升,甚至比傳統NLP方法更好。團隊還建立了保障隱私的合成資料集,並推出高準確率的「Mistral-small-psych」模型,泛用性也不錯。這證明針對醫療任務微調LLMs很重要,對西班牙語精神科研究很有幫助。 相關文章 PubMed DOI 推理

作者提出用問答編碼模型,讓大型語言模型回答理論設計的是非題,產生可解釋特徵來預測大腦反應。這方法在fMRI和ECoG資料上表現比現有模型好,產生的大腦地圖也符合過去研究,顯示LLM能有效連結理論與神經科學數據模型。 相關文章 PubMed DOI 推理

GraphCheck 是一套新型事實查核工具,結合知識圖譜和圖神經網路,能有效處理長篇、多層次關聯的內容。這讓大型語言模型在查核專業領域(如醫學)時更準確又省資源。實驗證明,GraphCheck 表現比現有方法更好,且用更少資源就能達到頂尖準確率。 相關文章 PubMed DOI 推理

醫療照護擴展困難,主因是人力、成本和法規限制。多代理人AI系統(多個AI協作)有望突破現有瓶頸,改善病患照護、行政流程和臨床決策。文章以敗血症管理為例,說明AI分工合作的應用,也提到慢性病和醫院流程優化。技術挑戰包括資料整合、品質控管和倫理問題。未來發展需重視驗證、監督和以病患為中心的設計。 相關文章 PubMed DOI 推理

GenePT 用 OpenAI 的 text-embedding 技術來分析基因表現,但有隱私疑慮。研究發現,Hugging Face 上的十款小型開源 transformer 模型,有些在基因分類任務上表現甚至比 OpenAI 更好,且更重視隱私。微調這些模型通常效果有限。 相關文章 PubMed DOI 推理