原始文章

本研究針對肝癌診斷提出一個結合大型與小型模型的輔助工具,旨在提升基層醫療醫生的診斷能力。透過開發更準確的肝腫瘤與血管分割模型,並整合患者醫療紀錄,這個框架能有效改善影像分析的準確性。結果顯示,小型模型在分割表現上有所提升,而大型模型則在醫生評估中獲得更高分數。此研究不僅優化了診斷過程,還增強了模型的可靠性與可解釋性,減少了錯誤推理的情況。 PubMed DOI


站上相關主題文章列表

這項研究評估了NotebookLM這款檢索增強生成大型語言模型(RAG-LLM)在肺癌分期中的有效性。透過整合日本肺癌分期指引的可靠外部知識,NotebookLM在100個虛構案例中達到86%的診斷準確率,表現優於金標準的GPT-4 Omni,後者在提供外部知識時準確率僅39%。NotebookLM在定位參考資料方面也表現出色,準確率高達95%。研究顯示,NotebookLM在臨床影像診斷中具備更高的可靠性與實用性,特別是在放射學領域。 PubMed DOI

這項研究探討大型語言模型(LLMs)與對比增強超聲肝臟影像報告系統(CEUS LI-RADS)結合,對高風險患者診斷小型肝細胞癌(sHCC)的效果。研究涵蓋403名未治療的高風險患者,評估的LLMs包括ChatGPT-4.0等。結果顯示,ChatGPT-4.0在CEUS LI-RADS分類上表現優於其他模型,且在檢測sHCC的敏感性上也優於ChatGPT-4o。整體而言,研究建議ChatGPT-4.0結合CEUS LI-RADS,可能成為診斷sHCC的有效工具。 PubMed DOI

準確的診斷對醫療保健至關重要,因為它是適時治療的基礎。雖然大型語言模型(LLMs)在學習上表現出色,但在臨床診斷的有效性仍需驗證。我們推出了MedFound,這是一個擁有1760億參數的醫療語言模型,經過大量醫療文本和臨床記錄的預訓練。透過自我引導和思維鏈方法,我們提升了其診斷推理能力。實驗結果顯示,MedFound在多種情境下表現優於其他模型,並能有效輔助醫生進行疾病診斷。 PubMed DOI

大型語言模型正在改變醫療領域,特別是在臨床決策支持和資訊提取方面。這些模型的語言理解能力幫助病理學家從知識庫中檢索準確資訊以進行診斷。我們提出了一個框架,結合檢索增強生成技術與提示工程,並提供了涵蓋腎臟疾病的臨床數據語料庫。透過多樣的提示技術,模型在疾病診斷的表現顯著提升,特別是在上下文相關性上獲得完美的1.0分,顯示出優秀的對話對齊能力。 PubMed DOI

大型語言模型(LLMs)在醫療保健,特別是胃腸科,展現出提升臨床決策、研究及病人管理的潛力。為了安全有效地應用這些模型,必須解決偏見、幻覺及法規遵循等挑戰。本文提出一個結構化框架,針對C型肝炎治療進行案例研究,涵蓋臨床目標定義、多學科團隊組建、數據準備、模型選擇與微調等步驟。此外,還強調遵循HIPAA和GDPR等法規,以確保負責任的AI應用。未來研究應聚焦於多機構驗證及AI輔助的臨床試驗。 PubMed DOI

這項研究發現,ChatGPT-4o在診斷肝臟局部病灶時,表現大致和資淺放射科醫師差不多,但還是比不上有經驗的醫師。把ChatGPT-4o加入診斷流程,也沒明顯提升醫師的診斷表現。總結來說,目前大型語言模型對診斷這類疾病的幫助有限,準確度還有待加強。 PubMed DOI

這項研究發現,結合多種大型語言模型(如Gemini-GPT)在預測肝細胞癌免疫治療反應上,表現和資深醫師差不多,甚至比資淺醫師更好。不過,模型的敏感度還是比資深醫師低。整體來說,這些AI工具未來有機會協助醫師做臨床決策。 PubMed DOI

大型語言模型在癌症影像領域應用越來越多,像是自動產生報告、分類影像、整合臨床指引,還能幫助病人理解報告。未來有機會協助腫瘤委員會討論、治療管理和預測副作用。不過,目前還有幻覺和表現不穩定等問題,限制臨床應用。 PubMed DOI

這項研究比較五款主流大型語言模型解讀胸部CT報告的能力,發現GPT-4表現最佳,尤其在選擇題上最準確。微調後的GPT-3.5-Turbo也有明顯進步。整體來說,選擇題比開放式問答更容易答對。不同疾病和器官系統的結果有差異。結果顯示,優化後的AI模型有助於提升胸部CT解讀,對外科手術規劃很有幫助。 PubMed DOI

這項研究用88份真實MRI肝臟病灶報告,測試多款大型語言模型的分類能力。結果發現,Claude 3.5 Sonnet準確率最高,勝過GPT-4o等其他模型。雖然LLM有潛力協助醫療診斷,但臨床應用前還需更多驗證,嚴謹測試也很重要。 PubMed DOI