原始文章

這項研究比較了三種放射組學模型(邏輯回歸、隨機森林和支持向量機)與臨床預測圖在預測前列腺癌患者淋巴結侵犯(LNI)的表現。分析包含95名接受mp-MRI及根治性前列腺切除術的患者,收集影像學、臨床及組織學數據。手動分割病變後,提取了343個特徵,隨機森林模型在DWI和ADC的預測準確率上表現最佳,顯示出比臨床預測圖更高的診斷準確性。 PubMed DOI


站上相關主題文章列表

研究發現NLR與CI-AKI有關,可用NLR等因素預測CI-AKI。2230名接受血管介入治療的病患中,NLR是獨立風險因素。多種機器學習模型中,納伊貝斯模型效果最好。NLR、血清肌酸酐、血糖及β-阻斷劑使用是重要因素。總結,NLR與CI-AKI有明顯相關,納伊貝斯模型表現最佳。 PubMed DOI

研究開發了一個結合超級微血管成像(SMI)、深度學習、放射組織學特徵和臨床因素的預測模型,可以區分免疫球蛋白A腎病(IgAN)和非IgAN。經驗證後,發現此模型在準確區分兩種情況上表現優異。這個結合式預測模型可協助醫生為腎病患者制定更明確的治療方針。 PubMed DOI

人工智慧在放射學報告生成方面有進步,但評估AI報告仍有挑戰。結合放射科醫師專業知識與GPT-3.5、GPT-4等大型語言模型,使用ICIL和CoT推理對齊評估標準。透過回歸模型聚合分數進行比較,實驗結果顯示此方法優於現有指標。穩健性已驗證,將釋出專家註釋以增進AI醫學報告評估品質。 PubMed DOI

這項研究比較了一個經過微調的大型語言模型(LLM)與放射科醫師在從放射學報告中識別肺癌預防治療患者方面的表現。LLM在分類患者方面表現出高準確度和敏感度,與放射科醫師相似,但處理時間更快。研究結果表明,LLM能夠有效地及時從醫療記錄中提取相關信息。 PubMed DOI

研究比較了GPT-4V和Gemini Pro Vision等大型語言模型在診斷能力上的表現,結果顯示隨著溫度設定提高,準確性也增加。儘管放射科醫師整體表現較佳,尤其在高溫度下,但這些模型在診斷決策上顯示出潛力成為輔助工具。 PubMed DOI

研究利用AI-LLMs提取臨床資訊,改善影像分析,預測膀胱癌患者手術後五年存活率。共有781位患者資料,AI-LLMs從醫療記錄中提取臨床描述符。開發了多模態預測模型CRD,準確率達74%至97%。CRD模型表現良好,AUC值範圍0.83至0.89。研究顯示AI-LLMs提取臨床資訊可改善膀胱癌患者預測模型。 PubMed DOI

這項研究評估了一個經過微調的大型語言模型(LLM)在識別骨轉移患者的有效性,並與放射科醫師的手動標註進行比較。研究分析了15,456名患者的報告,LLM在711份報告中準確率達97.9%,敏感度分別為98.8%、94.7%和94.3%。雖然放射科醫師的準確率和敏感度稍高,但LLM的分類時間僅需105秒,遠低於醫師的2312秒和3094秒。總體來看,這個LLM在檢測骨轉移方面表現出色,且速度更快。 PubMed DOI

這項研究比較了ChatGPT大型語言模型(LLMs)與不同經驗的人類讀者在肺癌分期的表現。研究納入700名非小細胞肺癌患者,使用胸部CT和FDG PET/CT報告進行分析。結果顯示,GPT-4o的準確率為74.1%,優於其他模型和一位住院醫師,但仍低於專科訓練的放射科醫生。這表明,雖然LLMs在某些方面表現不錯,但在癌症分期等複雜任務中,專業醫療人員的角色仍然不可或缺。 PubMed DOI

這項研究評估大型語言模型(LLMs)在解釋乳腺影像報告及提供臨床建議的表現,分為兩個步驟: 1. **文本評估**:比較十個LLMs與放射科醫師在100道BI-RADS選擇題上的準確率。Claude 3.5 Sonnet表現最佳(90%),超過一般放射科醫師(78%)和乳腺放射科醫師(82%)。 2. **視覺評估**:測試五個多模態LLMs在100張乳腺超音波影像上的表現,Claude 3.5 Sonnet以59%準確率領先。 研究顯示,雖然LLMs在文本評估中表現良好,但視覺診斷能力有限,需在放射科醫師監督下使用,以避免誤診。 PubMed DOI

這項研究評估了10個大型語言模型(LLMs)與2位認證放射科醫生在分析胸部放射學案例的診斷表現。研究收集了124個案例,結果顯示Claude 3 Opus的診斷準確率最高,達70.29%,而放射科醫生的準確率則較低,分別為52.4%和41.1%。LLMs在特定案例中的表現較佳,顯示在適當醫療監督下,LLMs可能成為臨床決策的重要工具。 PubMed DOI