原始文章

這項研究評估了多種大型語言模型(LLMs)在冠狀動脈疾病(CAD)診斷中的表現,特別是根據CAD-RADS 2.0指引進行比較。結果顯示,ChatGPT 4o的準確率最高,達到100%,接著是ChatGPT 4和Claude 3 Opus,準確率為96.6%。其他模型的準確率也不錯,介於90%到93.3%之間。這些結果顯示LLMs在改善CAD的放射報告和病人照護方面的潛力,並強調進一步研究其視覺診斷能力的重要性。 PubMed DOI


站上相關主題文章列表

結構化報告可以增進放射學工作流程,並促進醫師間的溝通。人工智慧在醫學領域的應用越來越普遍,大型語言模型(LLMs)被用於放射學的結構化報告。四個LLM模型被比較其知識和模板提議能力。LLMs在放射學中生成結構化報告方面顯示出潛力,但需要進一步的正式驗證。 PubMed DOI

研究比較大型語言模型(LLMs)和神經放射學家在臨床案例中的表現,結果顯示神經放射學家的判讀能力優於LLMs。ChatGPT和Glass AI表現相近,顯示在醫學文本訓練上有進步空間。LLMs雖有潛力,但仍需改進,顯示醫學領域仍需專業知識。 PubMed DOI

研究發現使用大型語言模型(LLMs)在放射學中預測臨床情境的效果。Glass AI在某些領域表現比ChatGPT好,但在其他情境中表現較差。整體而言,LLMs有助於預測影像研究,尤其是Glass AI,顯示了在放射學決策上的潛力。 PubMed DOI

研究比較四個大型語言模型在簡化放射學報告以提高患者閱讀易懂性的表現。結果顯示,所有模型都成功簡化報告,但在提供背景資料後效果更好。這顯示這些模型在幫助患者理解放射學報告方面有潛力。 PubMed DOI

研究利用大型語言模型協助臨床醫生問心臟超聲心動圖報告,提升對複雜心臟病患見解,增進患者護理效率。研究收集西奈山醫療體系10年數據,每患者有10份報告。LLM模型LLaMA-2 70B回答問題準確率達90%,尤其在嚴重程度評估和診斷檢索表現較佳。研究顯示使用LLM解釋心臟超聲心動圖數據有效,比傳統搜索更佳,提高臨床決策和研究效率。 PubMed DOI

這項研究評估了四個大型語言模型(LLMs)的表現,包括 GPT-4、GPT-4 Turbo、GPT-4omni(GPT-4o)和 Gemini,針對 2023 年美國核心臟病學會的考試問題進行回答。分析了 168 道問題,結果顯示 GPT-4o 的正確回答中位數為 63.1%,優於其他模型。GPT-4、GPT-4 Turbo 和 Gemini 的中位數分別為 56.8%、60.7% 和 40.5%。GPT-4o 在文字問題上表現佳,但在醫學影像解讀方面仍需改進。 PubMed DOI

這項研究評估了大型語言模型(LLMs)在解讀Lung-RADS以進行肺癌篩檢中的整合,強調它們在改善放射學實務方面的潛力。結果顯示,Claude 3 Opus和Perplexity的準確率達到了驚人的96%,在表現上超越了其他模型。 PubMed DOI

這項研究評估大型語言模型(LLMs)在解釋乳腺影像報告及提供臨床建議的表現,分為兩個步驟: 1. **文本評估**:比較十個LLMs與放射科醫師在100道BI-RADS選擇題上的準確率。Claude 3.5 Sonnet表現最佳(90%),超過一般放射科醫師(78%)和乳腺放射科醫師(82%)。 2. **視覺評估**:測試五個多模態LLMs在100張乳腺超音波影像上的表現,Claude 3.5 Sonnet以59%準確率領先。 研究顯示,雖然LLMs在文本評估中表現良好,但視覺診斷能力有限,需在放射科醫師監督下使用,以避免誤診。 PubMed DOI

這項研究評估了10個大型語言模型(LLMs)與2位認證放射科醫生在分析胸部放射學案例的診斷表現。研究收集了124個案例,結果顯示Claude 3 Opus的診斷準確率最高,達70.29%,而放射科醫生的準確率則較低,分別為52.4%和41.1%。LLMs在特定案例中的表現較佳,顯示在適當醫療監督下,LLMs可能成為臨床決策的重要工具。 PubMed DOI

這項研究提出了一種新方法,結合大型語言模型(LLMs)與電腦輔助診斷(CAD)網絡,提升胸部X光片的醫學影像分析。雖然LLMs在自然語言處理上表現優異,但在醫學影像上通常不佳。這個框架利用LLMs的優勢,改善CAD系統的診斷準確性和報告生成,讓報告品質更高。使用ChatGPT後,診斷表現提升了16.42個百分點,GPT-3則在F1-score上提高了15.00個百分點。這種創新方法有潛力改變臨床決策過程,並改善病患互動。 PubMed DOI