原始文章

這項研究比較多種大型語言模型在判讀西班牙文MRI報告、找出上肢肌肉去神經支配相關神經的表現。研究用300份標註報告,並用多數決方式結合各模型預測,結果比單一模型更準確。這方法能協助放射科醫師判斷最可能受影響的神經。 PubMed DOI


站上相關主題文章列表

研究測試了精細調校的大型語言模型(LLM)在分類腦部磁振造影報告的效能。LLM表現高準確、敏感,且處理速度快,比人類放射科醫師更有效。結果顯示LLM在醫學影像分析上有潛力,與專業醫師相當。 PubMed DOI

這項研究探討大型語言模型(LLMs)在診斷神經腫瘤方面的潛力,特別是在不斷變化的WHO中樞神經系統腫瘤指導方針下。研究測試了ChatGPT-4o、Claude-3.5-sonnet和Llama3在30個神經病理案例中的表現。結果顯示,結合檢索增強生成(RAG)後,LLMs在識別腫瘤亞型上達到90%的準確率,顯示它們能成為神經病理學家在報告實踐中的有用工具,特別是在跟上最新分類變更方面。 PubMed DOI

這項研究評估了八種公開的大型語言模型(LLMs)在24個神經放射學臨床情境中提供影像建議的表現。評估模型包括GPT-4、ChatGPT、Bard、Bing Chat、Llama 2等。結果顯示,GPT-4表現最佳,提供23個最佳建議,其次是ChatGPT有20個,而Llama 2僅有5個最佳建議。這項研究強調了大型語言模型在臨床影像利用上的潛力,並探討了評估其表現的挑戰,具有重要意義。 PubMed DOI

這項研究評估了大型語言模型(LLMs),如ChatGPT和Claude,在脊椎病理的外科決策及放射影像解讀的有效性,並與經驗豐富的脊椎外科醫生進行比較。結果顯示,雖然LLMs能詳細描述MRI影像,但在準確識別病變及外科決策上表現不佳,準確率僅20%,遠低於外科醫生的100%。研究建議LLMs在輔助影像解讀和決策上有潛力,但需進一步發展以克服現有限制,並強調AI研究人員與臨床專家的合作重要性。 PubMed DOI

這項研究評估大型語言模型(LLMs)在翻譯放射科報告的效果。由於合格翻譯者不足,這對病人護理造成挑戰。研究團隊將100份合成報告翻譯成九種語言,並使用十個LLM進行自動翻譯,結果由18位放射科醫生評估。發現GPT-4的翻譯品質最佳,特別是在英德、英希、英泰和英土語言對上表現突出。雖然LLMs在清晰度和一致性上表現良好,但醫學術語的準確性仍需改進。總體來說,LLMs能有效翻譯放射科報告,但不同模型和語言的表現有所差異。 PubMed DOI

這項研究探討了大型語言模型(LLMs)在急性缺血性中風(AIS)病例中的應用,特別是機械性血栓切除術(MT)的適應性。研究分析了100名AIS患者的數據,LLM根據放射學報告、神經症狀、發病資訊和患者年齡進行判斷。結果顯示,該AI模型的整體準確率達88%,特異性96%,敏感性80%,曲線下面積為0.92,顯示出LLMs在整合醫療數據方面的潛力,並鼓勵進一步探索其在臨床的應用。 PubMed DOI

這項研究用私有大型語言模型在本地處理814份放射科報告,成功把內容重組、精簡,並依器官系統分類。Mixtral LLM表現最好,能減少超過53%冗詞,提升報告清晰度和結構。結果證明開源LLM不僅保障資料安全,也能有效簡化報告流程,幫助醫師更快掌握重點,優化臨床工作。 PubMed DOI

這項研究發現,ChatGPT-4o在診斷肝臟局部病灶時,表現大致和資淺放射科醫師差不多,但還是比不上有經驗的醫師。把ChatGPT-4o加入診斷流程,也沒明顯提升醫師的診斷表現。總結來說,目前大型語言模型對診斷這類疾病的幫助有限,準確度還有待加強。 PubMed DOI

這項研究開發了一套AI系統,能用大型語言模型自動從CT和MRI放射科報告中偵測新發急性或亞急性腦梗塞。模型在大量日文報告訓練下,對新發腦梗塞的敏感度高達0.891,整體準確率0.923,能快速分類並及早發出警示,協助臨床判斷。 PubMed DOI

這項研究比較五款主流大型語言模型解讀胸部CT報告的能力,發現GPT-4表現最佳,尤其在選擇題上最準確。微調後的GPT-3.5-Turbo也有明顯進步。整體來說,選擇題比開放式問答更容易答對。不同疾病和器官系統的結果有差異。結果顯示,優化後的AI模型有助於提升胸部CT解讀,對外科手術規劃很有幫助。 PubMed DOI