原始文章

乳腺癌是全球女性常見的癌症,而MRI是活檢前重要的非侵入性診斷工具。本研究提出一種新方法,利用BI-RADS系統對乳腺MRI報告進行分類,透過大型語言模型將自由文本轉為結構化格式,並解決缺失的類別資訊。為保護病患資料,使用本地部署的Qwen-Chat模型,並透過專業提示增強模型適應性。結果顯示,這種新方法在各項指標上優於現有技術,並在不同醫院的測試中證實其穩健性。 PubMed DOI


站上相關主題文章列表

這項研究評估了人類閱讀者與大型語言模型(LLMs)在三種語言的乳房影像報告中分配乳房影像報告和數據系統(BI-RADS)分類方面的一致性。LLMs與人類閱讀者顯示出中等程度的一致性,但存在高比例的不一致BI-RADS分類,可能對臨床管理產生負面影響。 PubMed DOI

放射學報告傳統上是自由文本,提取臨床信息困難。結構化報告(SR)標準化且易檢索。研究提出從義大利放射學報告中提取淋巴瘤患者CT分期的流程。使用自然語言處理和Transformer模型自動填寫SR。IT5模型表現良好,與GPT-3.5相當。研究證明Transformer模型在臨床信息提取上有效。 PubMed DOI

這項研究評估了大型語言模型(LLMs),特別是Open AI的GPT-4.0和Microsoft Bing的GPT-4,在將非結構化的乳房超音波報告轉換為結構化格式的有效性。研究分析了100份報告,結果顯示GPT-4.0在生成結構化報告、準確分配BI-RADS分類及提供管理建議方面均優於Bing。此外,GPT-4.0在預測良性和惡性特徵的能力也較佳,但仍不及資深放射科醫師。這顯示GPT-4.0在醫療報告處理上具有潛力。 PubMed DOI

這項研究評估大型語言模型(LLMs)在解釋乳腺影像報告及提供臨床建議的表現,分為兩個步驟: 1. **文本評估**:比較十個LLMs與放射科醫師在100道BI-RADS選擇題上的準確率。Claude 3.5 Sonnet表現最佳(90%),超過一般放射科醫師(78%)和乳腺放射科醫師(82%)。 2. **視覺評估**:測試五個多模態LLMs在100張乳腺超音波影像上的表現,Claude 3.5 Sonnet以59%準確率領先。 研究顯示,雖然LLMs在文本評估中表現良好,但視覺診斷能力有限,需在放射科醫師監督下使用,以避免誤診。 PubMed DOI

這項研究評估了ChatGPT-3.5在生成乳房超音波報告的BI-RADS分類的有效性,目的是提升醫療診斷的準確性和可解釋性。研究分析了131名患者的報告,並將AI生成的結果與57位醫生的報告進行比較。結果顯示,雖然AI在結構和清晰度上表現良好,但在BI-RADS分類準確性和惡性診斷上仍需改進。研究也探討了「思考鏈」方法,顯示AI在模擬臨床決策過程中的潛力,整體而言,ChatGPT-3.5對乳房超音波評估的診斷結果有助益。 PubMed DOI

這項研究評估大型語言模型(LLMs)在分析乳腺癌病理報告的有效性,特別是識別病理完全反應(pCR)。研究者使用兩種方法:提取不同變壓器模型的嵌入和微調GPT-2模型,分析351名接受新輔助化療的女性患者。優化後的結果顯示,敏感度達95.3%,陽性預測值90.9%,F1分數93.0%。這顯示LLMs在提取臨床數據上優於傳統機器學習模型,並強調其在改善病人護理和乳腺癌管理的潛力,但仍需進一步驗證以確保結果的可靠性。 PubMed DOI

這項研究針對缺乏公開數據集的問題,探討如何根據乳腺影像報告及BI-RADS類別進行分類。研究團隊建立了一個包含5046份西班牙語放射學報告的數據集,經過認證的放射科醫生標註後翻譯成英文。經過預處理後,使用多種機器學習和深度學習分類器進行分析。結果顯示,BioGPT分類器的表現最佳,平均靈敏度達0.60,優於BERT的0.54。這項研究為未來BI-RADS分類的研究提供了基準數據集和基線結果,促進該領域的發展。 PubMed DOI

這項研究探討使用AI模型ChatGPT-4o來簡化乳房放射學報告,讓病人更容易理解。經驗豐富的放射科醫師選擇了21份匿名報告,並請ChatGPT-4o用簡單語言解釋。五位放射科醫師評估簡化報告的準確性、完整性和潛在危害,結果顯示簡化報告在準確性和完整性上表現良好,且潛在危害低。非醫療背景的讀者對簡化報告的理解度也很高。研究指出,雖然BI-RADS 0、1和2的報告較易解釋,但BI-RADS 3-6則較具挑戰性。總體而言,這顯示AI能有效改善病人對乳房影像報告的理解,促進以病人為中心的護理。 PubMed DOI

這項研究評估大型語言模型(LLMs)在前列腺MRI報告中分配PI-RADS類別的效果。研究對象為100名未接受活檢的患者,MRI報告由兩位泌尿放射科醫師分類,並與GPT-3.5、GPT-4、Bard和Gemini的結果進行比較。結果顯示,放射科醫師的準確率高達95%和90%,而GPT-3.5和Bard僅67%。更新的GPT-4和Gemini分別提高至83%和79%。整體而言,LLMs在準確性上仍不及人類醫師,臨床應用需謹慎考量。 PubMed DOI

這項研究評估了ChatGPT-4和ChatGPT-4o在乳腺癌影像報告及BI-RADS分數生成的有效性。研究使用了77張來自radiopaedia.org的影像,包含乳房X光和超音波,並在不同會議中進行評估以避免偏見。結果顯示,兩個模型在BI-RADS評分的準確率為66.2%,在BI-RADS 5案例中表現最佳(ChatGPT-4為84.4%,ChatGPT-4o為88.9%)。不過,它們在BI-RADS 1-3案例中常常給予過高的嚴重性評分,顯示目前大型語言模型在乳腺影像評估上的局限性,需進一步研究才能整合進臨床實踐。 PubMed DOI