原始文章

這項研究評估了一個經過微調的大型語言模型(LLM)在識別骨轉移患者的有效性,並與放射科醫師的手動標註進行比較。研究分析了15,456名患者的報告,LLM在711份報告中準確率達97.9%,敏感度分別為98.8%、94.7%和94.3%。雖然放射科醫師的準確率和敏感度稍高,但LLM的分類時間僅需105秒,遠低於醫師的2312秒和3094秒。總體來看,這個LLM在檢測骨轉移方面表現出色,且速度更快。 PubMed DOI


站上相關主題文章列表

研究比較了不同大型語言模型在放射學自動摘要生成的效果,重點在於準確的摘要對準確傳達放射學發現至關重要。研究使用T5和BART模型進行微調和零-shot學習,並與RNN進行比較。結果顯示,T5模型在Rouge-L分數達到0.638,且人類評判顯示T5生成的摘要與專業放射科醫師相似度高達70%。研究指出,自然語言處理和語言模型技術的進步有助於提升放射學摘要生成工具,對放射科醫師的工作有所助益。 PubMed DOI

這項研究評估了一個開源的大型語言模型(LLM)在從急診腦部MRI報告中提取信息的表現。對比了放射科醫師和LLM在識別頭痛、異常發現以及MRI結果與頭痛之間因果關係方面的能力。LLM在這些任務中表現出高靈敏度和特異度,顯示其具有潛力在不需額外訓練的情況下從放射學報告中準確提取信息。 PubMed DOI

放射學影像在醫學診斷中非常重要,對治療方向有關鍵影響。準確的放射學報告至關重要,常需與手術結果對照。手動比對費時費力,因此研究使用大型語言模型(LLM)自動提取報告關鍵細節,專注於肩部結構。LLM能識別放射學和手術報告中的特定結構,有助簡化評估過程。 PubMed DOI

這項研究比較了一個經過微調的大型語言模型(LLM)與放射科醫師在從放射學報告中識別肺癌預防治療患者方面的表現。LLM在分類患者方面表現出高準確度和敏感度,與放射科醫師相似,但處理時間更快。研究結果表明,LLM能夠有效地及時從醫療記錄中提取相關信息。 PubMed DOI

研究測試了精細調校的大型語言模型(LLM)在分類腦部磁振造影報告的效能。LLM表現高準確、敏感,且處理速度快,比人類放射科醫師更有效。結果顯示LLM在醫學影像分析上有潛力,與專業醫師相當。 PubMed DOI

這項研究探討小型大型語言模型(sLLM)在從病理報告中提取關鍵資訊的效果。使用三個版本的Llama 2模型,參數從70億到700億不等,並在零樣本和五樣本學習情境下進行評估。結果顯示,700億參數的模型在五樣本情境下表現優異,顯示sLLM能有效提升數據提取的效率與準確性。研究強調範例學習的重要性,並討論模型大小、準確性及處理時間的權衡,支持在臨床環境中應用先進語言模型,以改善病人護理和生物醫學研究。 PubMed DOI

這篇論文回顧了自然語言處理技術,特別是大型語言模型在放射科報告中提取結構化數據的應用。雖然放射影像使用普遍,但報告中的自由文本常未被充分利用。根據PRISMA-ScR指導方針,分析了2023年8月1日從五個資料庫中找到的34項研究。結果顯示,大多數研究集中在前變壓器和編碼器模型上,外部驗證時性能下降。LLMs可能增強信息提取的普遍適用性,但面臨外部驗證不足和報告粒度問題等挑戰。 PubMed DOI

這項研究比較了ChatGPT大型語言模型(LLMs)與不同經驗的人類讀者在肺癌分期的表現。研究納入700名非小細胞肺癌患者,使用胸部CT和FDG PET/CT報告進行分析。結果顯示,GPT-4o的準確率為74.1%,優於其他模型和一位住院醫師,但仍低於專科訓練的放射科醫生。這表明,雖然LLMs在某些方面表現不錯,但在癌症分期等複雜任務中,專業醫療人員的角色仍然不可或缺。 PubMed DOI

這項研究評估了10個大型語言模型(LLMs)與2位認證放射科醫生在分析胸部放射學案例的診斷表現。研究收集了124個案例,結果顯示Claude 3 Opus的診斷準確率最高,達70.29%,而放射科醫生的準確率則較低,分別為52.4%和41.1%。LLMs在特定案例中的表現較佳,顯示在適當醫療監督下,LLMs可能成為臨床決策的重要工具。 PubMed DOI

這項研究開發了一個大型語言模型(LLM),能根據影像生成放射學印象,並評估其專業及語言表現。研究在上海總醫院進行,六位放射科醫生使用該模型並進行修正。LLM在20 GB醫學及一般文本數據上預訓練,並用1.5 GB數據微調,包含800份放射學報告。結果顯示,LLM的中位召回率為0.775,精確度0.84,F1分數0.772,表現良好。專家對其印象評價高,顯示其在放射學檢查中具專業性。 PubMed DOI