原始文章

這項研究探討如何利用人工智慧反饋的強化學習(RLAIF)來改善大型語言模型(LLMs)在胸部CT報告摘要中與放射科醫師的對齊。研究使用了94,844份胸部CT報告,並由放射科醫師和人工智慧模型進行審查。結果顯示,經過RLAIF微調後,LLMs的表現顯著提升,精確度、召回率和F1分數均有改善,且放射科醫師與AI的排名一致率達77.9%。這顯示人工智慧在臨床報告摘要中具有潛力,為未來放射學的發展奠定基礎。 PubMed DOI


站上相關主題文章列表

人工智慧在放射學報告生成方面有進步,但評估AI報告仍有挑戰。結合放射科醫師專業知識與GPT-3.5、GPT-4等大型語言模型,使用ICIL和CoT推理對齊評估標準。透過回歸模型聚合分數進行比較,實驗結果顯示此方法優於現有指標。穩健性已驗證,將釋出專家註釋以增進AI醫學報告評估品質。 PubMed DOI

這項研究探討如何利用大型語言模型(LLMs)來提升放射科住院醫師的回饋,特別是找出他們初步報告中遺漏的診斷。研究分析了500對初步與最終報告,使用的LLM(GPT-4)成功識別出24個獨特的遺漏診斷,敏感度達79.2%。來自14位住院醫師的回饋顯示,他們對LLM生成的回饋滿意度平均為3.50,感知準確度為3.64(滿分5分)。大多數醫師偏好將LLM回饋與傳統回饋結合,顯示LLMs能有效補充傳統回饋方法。 PubMed DOI

這項研究開發了一個大型語言模型(LLM),能根據影像生成放射學印象,並評估其專業及語言表現。研究在上海總醫院進行,六位放射科醫生使用該模型並進行修正。LLM在20 GB醫學及一般文本數據上預訓練,並用1.5 GB數據微調,包含800份放射學報告。結果顯示,LLM的中位召回率為0.775,精確度0.84,F1分數0.772,表現良好。專家對其印象評價高,顯示其在放射學檢查中具專業性。 PubMed DOI

這項研究旨在提升一個開源的大型語言模型(LLM),自動生成來自不同醫院的放射學報告印象,涵蓋CT、超音波和MRI等影像檢查。研究人員使用UCSF醫療中心和Zuckerberg舊金山總醫院的大數據集,透過ROUGE分數評估模型表現。結果顯示,該LLM與專科醫師撰寫的印象有顯著重疊,雖然外部驗證時表現稍降。針對CT胸部檢查的讀者研究顯示,模型生成的印象在臨床和語法準確性上表現良好,顯示其在輔助放射科醫師工作中的潛力。 PubMed DOI

深度學習在放射學的應用有助於改善診斷,但臨床接受度仍有挑戰。本研究開發了一個基於Llama 3-8B的語言模型,旨在自動生成MRI和CT報告的結論,以協助放射科醫生並提升效率。使用了15,000份來自克拉約瓦醫藥與藥學大學的報告數據進行訓練,並在NVIDIA RTX 3090 GPU上進行微調。結果顯示,模型在生成結論的準確性上表現良好,並獲得放射科醫生的正面評價。未來需解決數據偏見及臨床整合等問題。 PubMed DOI

這項研究評估大型語言模型(LLMs)在翻譯放射科報告的效果。由於合格翻譯者不足,這對病人護理造成挑戰。研究團隊將100份合成報告翻譯成九種語言,並使用十個LLM進行自動翻譯,結果由18位放射科醫生評估。發現GPT-4的翻譯品質最佳,特別是在英德、英希、英泰和英土語言對上表現突出。雖然LLMs在清晰度和一致性上表現良好,但醫學術語的準確性仍需改進。總體來說,LLMs能有效翻譯放射科報告,但不同模型和語言的表現有所差異。 PubMed DOI

在放射學中,人工智慧(AI)已改善報告生成,但評估這些報告仍具挑戰。傳統評估指標常無法捕捉臨床細微語義,或過於專注細節,影響報告清晰度。為解決此問題,我們結合放射科醫師專業知識與大型語言模型(如GPT-3.5和GPT-4),採用上下文指導學習和思維鏈推理,促進AI與人類報告的比較。實驗顯示,我們的方法在評估準確性上顯著優於現有指標,並計劃公開放射科專家註解,為未來評估建立新基準。 PubMed DOI

最近大型語言模型(LLMs)如GPT-3.5和GPT-4在醫療領域的應用引起關注。本研究比較了這些模型在註解放射學報告及生成胸部CT印象的表現,旨在協助醫療專業人員處理日常文檔任務。研究使用了上下文學習和檢索增強生成等方法,並透過多種指標進行評估。結果顯示,GPT-4在性能上優於GPT-3.5,且提示設計對結果影響顯著。研究建議在醫療實踐中整合這些先進模型,以提升文檔效率與準確性。 PubMed DOI

這項研究探討大型語言模型(LLMs)在評估和修訂一年級住院醫師撰寫的放射科報告的效果,並與專業放射科醫師進行比較。分析了100份報告,根據六個準確性和完整性標準進行評估。結果顯示,GPT-4o 與人類醫師的意見一致性最高,住院醫師的報告技能在第一年內有顯著進步,尤其在前三個標準上。研究建議LLMs能有效協助住院醫師識別弱點並追蹤進展,減輕導師的工作負擔。 PubMed DOI

大型語言模型(LLMs)如ChatGPT、Llama和Claude,正在改變醫療保健,特別是在放射科。最近,弗賴堡和巴塞爾大學醫院的研究顯示,這些系統能有效整合影像存檔與傳輸系統(PACS)和電子健康紀錄(EHR),提升醫師效率,縮短報告時間,並自動化例行任務。研究結果顯示,LLMs不僅提高了診斷質量,還促進了跨學科合作。未來應著重增強透明度和擴大應用範圍,確保遵守倫理和法律標準。 PubMed DOI