原始文章

這篇文章介紹了一種名為知識感知注意力網絡(LKAN)的新技術,專門用於肝癌的臨床分期,這對於診斷和治療原發性肝癌非常重要。現有的分期系統依賴醫生解讀放射學報告,但面臨類別不平衡、專業術語處理困難及報告冗長等挑戰。LKAN結合大型語言模型和規則算法,增強數據多樣性,並在未標記的肝癌報告上進行預訓練,改善學習效果。結果顯示,LKAN的準確率達90.3%,表現優於基準模型,且代碼已在GitHub上公開。 PubMed DOI


站上相關主題文章列表

LLMs如ChatGPT和Med-PaLM在醫學問答表現優秀,但在非英語環境面臨挑戰。KFE框架提升中文醫學表現,整合臨床知識。像ChatGPT和GPT-4在CNMLE-2022有顯著進步,超越人類並通過考試。研究指出結合醫學知識與LLMs的情境學習有效,可橋接全球醫療語言障礙,減少不平等。 PubMed DOI

這項研究比較了一個經過微調的大型語言模型(LLM)與放射科醫師在從放射學報告中識別肺癌預防治療患者方面的表現。LLM在分類患者方面表現出高準確度和敏感度,與放射科醫師相似,但處理時間更快。研究結果表明,LLM能夠有效地及時從醫療記錄中提取相關信息。 PubMed DOI

這項研究致力於開發一個針對傳統中醫的語言模型,旨在提升臨床推理能力,如診斷和處方建議。研究人員創建了三個重要數據集,並開發了Lingdan預訓練模型及兩個專門模型,分別用於症狀分析和草藥處方建議。這些模型在中醫知識回答和處方建議上表現優異,Lingdan-PR的F1-score比最佳基準提高了18.39%。這項研究顯示了人工智慧在改善醫療決策中的潛力,相關資料可在 https://github.com/TCMAI-BJTU/LingdanLLM 獲得。 PubMed DOI

這項研究評估了一個經過微調的大型語言模型(LLM)在識別骨轉移患者的有效性,並與放射科醫師的手動標註進行比較。研究分析了15,456名患者的報告,LLM在711份報告中準確率達97.9%,敏感度分別為98.8%、94.7%和94.3%。雖然放射科醫師的準確率和敏感度稍高,但LLM的分類時間僅需105秒,遠低於醫師的2312秒和3094秒。總體來看,這個LLM在檢測骨轉移方面表現出色,且速度更快。 PubMed DOI

這項研究比較了ChatGPT大型語言模型(LLMs)與不同經驗的人類讀者在肺癌分期的表現。研究納入700名非小細胞肺癌患者,使用胸部CT和FDG PET/CT報告進行分析。結果顯示,GPT-4o的準確率為74.1%,優於其他模型和一位住院醫師,但仍低於專科訓練的放射科醫生。這表明,雖然LLMs在某些方面表現不錯,但在癌症分期等複雜任務中,專業醫療人員的角色仍然不可或缺。 PubMed DOI

這項研究提出了一種新方法,結合大型語言模型(LLMs)與電腦輔助診斷(CAD)網絡,提升胸部X光片的醫學影像分析。雖然LLMs在自然語言處理上表現優異,但在醫學影像上通常不佳。這個框架利用LLMs的優勢,改善CAD系統的診斷準確性和報告生成,讓報告品質更高。使用ChatGPT後,診斷表現提升了16.42個百分點,GPT-3則在F1-score上提高了15.00個百分點。這種創新方法有潛力改變臨床決策過程,並改善病患互動。 PubMed DOI

這篇系統性回顧與統合分析探討大型語言模型(LLMs)在臨床腫瘤學的應用,分析了34項研究以評估其表現。研究發現,LLMs主要測試回答腫瘤學問題的能力,但因方法論和評估標準不同,表現上有顯著變異。模型能力、提示策略及特定腫瘤領域等因素影響這些變異。此外,LLMs缺乏標準化報告協議,造成方法論不一致。解決這些問題對提升研究可比性及促進LLM在臨床實踐中的應用至關重要。 PubMed DOI

這項研究開發了一個大型語言模型(LLM),用於根據MRI報告自動分類肝臟觀察,依據LI-RADS v2018指導方針。研究分析了291個肝臟觀察,並將其分為訓練、驗證和測試集。結果顯示,模型在LI-RADS分類上有中等一致性(κ = 0.54),對於惡性腫瘤的識別也有不錯的表現。使用LLM後,放射科醫師的工作量減少了45%,顯示出該模型在臨床應用中的潛力,能有效提升數據整理效率。 PubMed DOI

這項研究評估了NotebookLM這款檢索增強生成大型語言模型(RAG-LLM)在肺癌分期中的有效性。透過整合日本肺癌分期指引的可靠外部知識,NotebookLM在100個虛構案例中達到86%的診斷準確率,表現優於金標準的GPT-4 Omni,後者在提供外部知識時準確率僅39%。NotebookLM在定位參考資料方面也表現出色,準確率高達95%。研究顯示,NotebookLM在臨床影像診斷中具備更高的可靠性與實用性,特別是在放射學領域。 PubMed DOI

這項研究評估大型語言模型(LLMs)在識別晚期癌症患者的預立醫療計畫(ACP)文件的有效性。研究在達納法伯癌症中心進行,將LLM的表現與傳統手動查閱和自然語言處理(NLP)方法比較。使用GPT-4,研究聚焦於護理目標、生命延續治療限制及安寧緩和醫療等關鍵領域。結果顯示LLM在敏感性和特異性上表現良好,整體準確率介於0.81到0.91之間,特別在複雜主題上優於NLP。雖然精確度略低,但LLM的假陽性對臨床管理仍具相關性,建議進一步研究以增強此方法。 PubMed DOI