Application of NotebookLM, a large language model with retrieval-augmented generation, for lung cancer staging.
NotebookLM 在肺癌分期中的應用：一種具有檢索增強生成的大型語言模型。 Jpn J Radiol 2024-11-25

這項研究評估了NotebookLM這款檢索增強生成大型語言模型（RAG-LLM）在肺癌分期中的有效性。透過整合日本肺癌分期指引的可靠外部知識，NotebookLM在100個虛構案例中達到86%的診斷準確率，表現優於金標準的GPT-4 Omni，後者在提供外部知識時準確率僅39%。NotebookLM在定位參考資料方面也表現出色，準確率高達95%。研究顯示，NotebookLM在臨床影像診斷中具備更高的可靠性與實用性，特別是在放射學領域。 PubMed DOI

Feasibility of large language models for CEUS LI-RADS categorization of small liver nodules in patients at risk for hepatocellular carcinoma.
大型語言模型在高風險肝細胞癌患者小肝結節的CEUS LI-RADS分類的可行性。 Front Oncol 2025-01-02

這項研究探討大型語言模型（LLMs）與對比增強超聲肝臟影像報告系統（CEUS LI-RADS）結合，對高風險患者診斷小型肝細胞癌（sHCC）的效果。研究涵蓋403名未治療的高風險患者，評估的LLMs包括ChatGPT-4.0等。結果顯示，ChatGPT-4.0在CEUS LI-RADS分類上表現優於其他模型，且在檢測sHCC的敏感性上也優於ChatGPT-4o。整體而言，研究建議ChatGPT-4.0結合CEUS LI-RADS，可能成為診斷sHCC的有效工具。 PubMed DOI

A generalist medical language model for disease diagnosis assistance.
一個通用醫學語言模型用於疾病診斷輔助。 Nat Med 2025-01-08

準確的診斷對醫療保健至關重要，因為它是適時治療的基礎。雖然大型語言模型（LLMs）在學習上表現出色，但在臨床診斷的有效性仍需驗證。我們推出了MedFound，這是一個擁有1760億參數的醫療語言模型，經過大量醫療文本和臨床記錄的預訓練。透過自我引導和思維鏈方法，我們提升了其診斷推理能力。實驗結果顯示，MedFound在多種情境下表現優於其他模型，並能有效輔助醫生進行疾病診斷。 PubMed DOI

LLM-based kidney disease diagnostic framework for Pathologists.
基於 LLM 的腎臟疾病診斷框架供病理學家使用。 Annu Int Conf IEEE Eng Med Biol Soc 2025-03-05

大型語言模型正在改變醫療領域，特別是在臨床決策支持和資訊提取方面。這些模型的語言理解能力幫助病理學家從知識庫中檢索準確資訊以進行診斷。我們提出了一個框架，結合檢索增強生成技術與提示工程，並提供了涵蓋腎臟疾病的臨床數據語料庫。透過多樣的提示技術，模型在疾病診斷的表現顯著提升，特別是在上下文相關性上獲得完美的1.0分，顯示出優秀的對話對齊能力。 PubMed DOI

Utilizing large language models for gastroenterology research: a conceptual framework.
利用大型語言模型進行胃腸病學研究：一個概念框架。 Therap Adv Gastroenterol 2025-04-02

大型語言模型（LLMs）在醫療保健，特別是胃腸科，展現出提升臨床決策、研究及病人管理的潛力。為了安全有效地應用這些模型，必須解決偏見、幻覺及法規遵循等挑戰。本文提出一個結構化框架，針對C型肝炎治療進行案例研究，涵蓋臨床目標定義、多學科團隊組建、數據準備、模型選擇與微調等步驟。此外，還強調遵循HIPAA和GDPR等法規，以確保負責任的AI應用。未來研究應聚焦於多機構驗證及AI輔助的臨床試驗。 PubMed DOI

Large Language Models for Diagnosing Focal Liver Lesions From CT/MRI Reports: A Comparative Study With Radiologists.
利用大型語言模型從CT/MRI報告診斷肝臟局灶性病變：與放射科醫師的比較研究 Liver Int 2025-05-10

這項研究發現，ChatGPT-4o在診斷肝臟局部病灶時，表現大致和資淺放射科醫師差不多，但還是比不上有經驗的醫師。把ChatGPT-4o加入診斷流程，也沒明顯提升醫師的診斷表現。總結來說，目前大型語言模型對診斷這類疾病的幫助有限，準確度還有待加強。 PubMed DOI

Predicting Immunotherapy Response in Unresectable Hepatocellular Carcinoma: A Comparative Study of Large Language Models and Human Experts.
不可切除性肝細胞癌免疫治療反應之預測：大型語言模型與人類專家之比較研究 J Med Syst 2025-05-15

這項研究發現，結合多種大型語言模型（如Gemini-GPT）在預測肝細胞癌免疫治療反應上，表現和資深醫師差不多，甚至比資淺醫師更好。不過，模型的敏感度還是比資深醫師低。整體來說，這些AI工具未來有機會協助醫師做臨床決策。 PubMed DOI

Large Language Models in Cancer Imaging: Applications and Future Perspectives.
癌症影像中的大型語言模型：應用與未來展望 J Clin Med 2025-05-28

大型語言模型在癌症影像領域應用越來越多，像是自動產生報告、分類影像、整合臨床指引，還能幫助病人理解報告。未來有機會協助腫瘤委員會討論、治療管理和預測副作用。不過，目前還有幻覺和表現不穩定等問題，限制臨床應用。 PubMed DOI

Performance analysis of large language models in multi-disease detection from chest computed tomography reports: a comparative study: Experimental Research.
大型語言模型於胸部電腦斷層報告多重疾病偵測之表現分析：比較性研究 Int J Surg 2025-06-11

這項研究比較五款主流大型語言模型解讀胸部CT報告的能力，發現GPT-4表現最佳，尤其在選擇題上最準確。微調後的GPT-3.5-Turbo也有明顯進步。整體來說，選擇題比開放式問答更容易答對。不同疾病和器官系統的結果有差異。結果顯示，優化後的AI模型有助於提升胸部CT解讀，對外科手術規劃很有幫助。 PubMed DOI

Leveraging large language models for accurate classification of liver lesions from MRI reports.
運用大型語言模型精確分類MRI報告中的肝臟病灶 Comput Struct Biotechnol J 2025-06-12

這項研究用88份真實MRI肝臟病灶報告，測試多款大型語言模型的分類能力。結果發現，Claude 3.5 Sonnet準確率最高，勝過GPT-4o等其他模型。雖然LLM有潛力協助醫療診斷，但臨床應用前還需更多驗證，嚴謹測試也很重要。 PubMed DOI

原始文章

站上相關主題文章列表