原始文章

這項研究評估了一個安全的機構大型語言模型(LLM)在增強MRI脊椎檢查申請表及自動協議方面的效果。研究分析了218名患者的250份申請表,結果顯示LLM增強的申請表在臨床資訊充分性上達93.6-96.0%,遠高於臨床醫師的46.8-58.8%。LLM在78.4%的案例中提供正確的MRI協議建議,雖然低於放射科醫師的準確率,但在識別脊椎器械方面表現優異,準確率達95.1%。總體而言,LLM顯著提升了MRI申請表的質量,顯示出優化放射科醫師工作流程的潛力。 PubMed DOI


站上相關主題文章列表

研究比較了不同大型語言模型在放射學自動摘要生成的效果,重點在於準確的摘要對準確傳達放射學發現至關重要。研究使用T5和BART模型進行微調和零-shot學習,並與RNN進行比較。結果顯示,T5模型在Rouge-L分數達到0.638,且人類評判顯示T5生成的摘要與專業放射科醫師相似度高達70%。研究指出,自然語言處理和語言模型技術的進步有助於提升放射學摘要生成工具,對放射科醫師的工作有所助益。 PubMed DOI

放射學影像在醫學診斷中非常重要,對治療方向有關鍵影響。準確的放射學報告至關重要,常需與手術結果對照。手動比對費時費力,因此研究使用大型語言模型(LLM)自動提取報告關鍵細節,專注於肩部結構。LLM能識別放射學和手術報告中的特定結構,有助簡化評估過程。 PubMed DOI

這項研究開發了一個大型語言模型(LLM),能根據影像生成放射學印象,並評估其專業及語言表現。研究在上海總醫院進行,六位放射科醫生使用該模型並進行修正。LLM在20 GB醫學及一般文本數據上預訓練,並用1.5 GB數據微調,包含800份放射學報告。結果顯示,LLM的中位召回率為0.775,精確度0.84,F1分數0.772,表現良好。專家對其印象評價高,顯示其在放射學檢查中具專業性。 PubMed DOI

這項研究評估了多種大型語言模型(LLMs)在簡化介入放射學(IR)報告的表現,重點在質性和量性指標。GPT-4和Claude-3-Opus在質性評估中表現最佳,錯誤率最低,特別是在內容和信任方面。量性評估顯示,GPT-4在可讀性指標上也優於其他模型。研究強調簡化IR報告對病人理解和臨床決策的重要性,並指出所有模型仍需改進以減少錯誤。 PubMed DOI

放射學中的結構化報告在可比性、可讀性和細節上有明顯優勢,但其採用仍然有限。本研究探討了一種本地托管的語言模型,能將自由文本的放射報告轉換為結構化數據,且不影響放射科醫師的工作流程。研究結果顯示,該模型生成的結構化報告在英語和德語的準確性接近人類讀者,顯示出良好的性能。結論指出,為了提高結構化報告的採用,需加強自動化系統與臨床流程的整合,讓醫師能在報告過程中受益於結構化數據。 PubMed DOI

這項研究探討了多種大型語言模型(LLMs)在生成退化性頸椎MRI報告的放射學印象的效果。比較了OpenAI的ChatGPT-3.5、GPT-4、Anthropic的Claude 2、Google的Bard和Meta的Llama 2,使用50份合成MRI報告進行評估。結果顯示,Claude 2在大多數情況下表現最佳,穩定性高,而GPT-4則需重新訓練以改善表現。研究指出,LLMs,特別是Claude 2,對自動生成放射學印象有潛力,但仍需進一步研究以優化性能和實際應用效果。 PubMed DOI

放射學中的結構化報告(SR)旨在提升報告質量,但採用率仍然不高。近期大型語言模型(LLMs)的進展,特別是GPT-3.5和GPT-4,顯示出自動化SR的潛力。這篇回顧探討了LLMs在放射報告中的應用,包括文檔編寫、翻譯、臨床評估和數據挖掘等四個領域。雖然LLMs能提升SR的效率與準確性,但在臨床實踐中整合時仍需克服算法透明度和訓練數據的挑戰。 PubMed DOI

這項研究致力於開發一種整合大型語言模型(LLM;GPT4-Turbo)的自然語言處理(NLP)演算法,目的是自動從電子健康紀錄(EHRs)中提取脊椎手術數據。傳統的手動審查方法繁瑣且易出錯,因此自動化非常重要。演算法採用兩階段流程,先用基於規則的NLP框架識別文本,再由LLM進行驗證。結果顯示,這種方法在準確性、時間效率和成本上均優於傳統方式,顯示出在臨床應用的潛力。 PubMed DOI

這項研究評估了八種公開的大型語言模型(LLMs)在24個神經放射學臨床情境中提供影像建議的表現。評估模型包括GPT-4、ChatGPT、Bard、Bing Chat、Llama 2等。結果顯示,GPT-4表現最佳,提供23個最佳建議,其次是ChatGPT有20個,而Llama 2僅有5個最佳建議。這項研究強調了大型語言模型在臨床影像利用上的潛力,並探討了評估其表現的挑戰,具有重要意義。 PubMed DOI

這項研究開發了一個基於BERT的大型語言模型,目的是透過整合MRI數據、文本報告和數值測量,提升腰椎疾病的診斷準確性。研究評估MRI影像的分割質量,並使用卷積神經網絡(CNN)提取關鍵特徵,如腰椎前凸角和椎間盤高度。數據集涵蓋28,065名患者,並透過CNN後處理精煉診斷標準。模型在514個經專家驗證的案例上進行外部驗證,顯示出高達0.9的分類性能,顯著提升腰椎疾病的診斷精度,支持更準確的治療計劃。 PubMed DOI