原始文章

這項研究開發了一套AI系統,能用大型語言模型自動從CT和MRI放射科報告中偵測新發急性或亞急性腦梗塞。模型在大量日文報告訓練下,對新發腦梗塞的敏感度高達0.891,整體準確率0.923,能快速分類並及早發出警示,協助臨床判斷。 PubMed DOI


站上相關主題文章列表

這項研究比較了一個經過微調的大型語言模型(LLM)與放射科醫師在從放射學報告中識別肺癌預防治療患者方面的表現。LLM在分類患者方面表現出高準確度和敏感度,與放射科醫師相似,但處理時間更快。研究結果表明,LLM能夠有效地及時從醫療記錄中提取相關信息。 PubMed DOI

研究測試了精細調校的大型語言模型(LLM)在分類腦部磁振造影報告的效能。LLM表現高準確、敏感,且處理速度快,比人類放射科醫師更有效。結果顯示LLM在醫學影像分析上有潛力,與專業醫師相當。 PubMed DOI

這項初步研究探討了大型語言模型(LLM),特別是LLaMA3,如何從三級醫院的出院摘要中提取中風審核數據。研究分析了一個月內的中風住院病人出院摘要,成功提取144個數據點,LLM的準確率高達93.8%(135個正確)。結果顯示,LLM能有效提升中風審核數據的收集效率,並建議進一步研究以優化LLM與醫療專業人員的合作。 PubMed DOI

腦出血是一種危急的醫療狀況,需迅速診斷和治療。雖然CT掃描是關鍵,但在資源有限的情況下,經驗不足的放射科醫生可能影響診斷效果。本研究探討使用GPT-4模型來識別CT掃描中的腦出血,分析了208個掃描結果。GPT-4的整體識別率為72.6%,在硬膜外和腦實質內出血表現最佳,但在慢性硬膜下出血方面較差。放射科醫生對GPT-4的表現給予正面評價,顯示其在放射影像領域的潛力。 PubMed DOI

這項研究評估了大型語言模型(LLMs)在急性缺血性中風(AIS)患者的手術記錄中提取數據的有效性。分析了382份手術記錄,重點在30份,以指導LLMs提取關鍵特徵。六種LLMs的表現良好,平均準確率達95.09%,整體準確率為78.05%。GLM4和GPT-4在進階特徵提取上表現突出,準確率分別為84.03%和82.20%。LLMs的數據處理速度也顯著快於醫師,顯示出在AIS治療中改善臨床數據管理的潛力。 PubMed DOI

這項研究探討了大型語言模型(LLMs)在急性缺血性中風(AIS)病例中的應用,特別是機械性血栓切除術(MT)的適應性。研究分析了100名AIS患者的數據,LLM根據放射學報告、神經症狀、發病資訊和患者年齡進行判斷。結果顯示,該AI模型的整體準確率達88%,特異性96%,敏感性80%,曲線下面積為0.92,顯示出LLMs在整合醫療數據方面的潛力,並鼓勵進一步探索其在臨床的應用。 PubMed DOI

研究團隊開發了 msLesionprompt,利用 ChatGPT-4 自動從多發性硬化症患者的 MRI 報告中,快速抓取新發炎性病灶的重點資訊。這工具能準確辨識新 T2 病灶和增強病灶,處理近 1.5 萬份報告又省時省錢,讓大規模分析治療效果和健康因素變得更容易,對 MS 研究很有幫助。 PubMed DOI

這項研究用大型語言模型,解決放射科報告標註資料不足的問題,能自動抓出危及生命的異常發現。模型在1.5萬份未標註報告訓練,經專家和AI評分驗證,準確度高,內外部資料都適用。這方法提升危急異常偵測力,已開放給研究和臨床使用。 PubMed DOI

這項研究發現,ChatGPT-4o在診斷肝臟局部病灶時,表現大致和資淺放射科醫師差不多,但還是比不上有經驗的醫師。把ChatGPT-4o加入診斷流程,也沒明顯提升醫師的診斷表現。總結來說,目前大型語言模型對診斷這類疾病的幫助有限,準確度還有待加強。 PubMed DOI

這項研究比較了Claude、GPT和Gemini三種大型語言模型,從日文頭部CT報告中擷取顱內出血和顱骨骨折資訊的表現。三種模型表現都不錯,其中以Claude最準確。提示設計會影響模型表現,尤其是Gemini。常見錯誤多因報告內容模糊。整體來說,大型語言模型能有效結構化放射報告,但提示設計還需優化,也要在不同語言和實際情境下再測試。 PubMed DOI