原始文章

這項研究發現,ChatGPT-4能用於肝臟超音波影像分析,準確率達76%、敏感度83%,表現接近傳統軟體,但分析速度快40%。雖然診斷準確率還有進步空間,但展現出AI自動化醫學影像分析的潛力。 PubMed DOI


站上相關主題文章列表

這項研究探討了大型語言模型(LLM)ChatGPT 在根據肝臟影像報告分類肝臟病變的能力,使用 MRI 報告進行比較。研究涵蓋 150 名患者的 205 份 MRI,重點在特定病變的大小、位置及動脈期對比增強標準。結果顯示,ChatGPT 在非結構化報告中的準確率(53%)高於結構化報告(44%),且在非結構化報告的協議程度(k = 0.51)也較佳。這顯示 LLM 在處理自由文本數據方面有潛力,但仍需優化以適應結構化數據。 PubMed DOI

這項研究評估了ChatGPT-3.5在生成乳房超音波報告的BI-RADS分類的有效性,目的是提升醫療診斷的準確性和可解釋性。研究分析了131名患者的報告,並將AI生成的結果與57位醫生的報告進行比較。結果顯示,雖然AI在結構和清晰度上表現良好,但在BI-RADS分類準確性和惡性診斷上仍需改進。研究也探討了「思考鏈」方法,顯示AI在模擬臨床決策過程中的潛力,整體而言,ChatGPT-3.5對乳房超音波評估的診斷結果有助益。 PubMed DOI

這項研究評估了大型語言模型(LLMs),特別是GPT-3.5和GPT-4,在診斷代謝功能障礙相關脂肪肝病(MASLD)的有效性,數據來自2017-2018年的NHANES。結果顯示,GPT-4的診斷準確性與傳統評分系統(如脂肪肝指數)相當,ROC曲線下面積(AUROC)分別為0.831、0.817和0.827,且優於GPT-3.5。此外,GPT-4V在解讀MASLD患者的超音波影像上顯示潛力,但準確性仍不及經驗豐富的放射科醫師。總體而言,GPT-4在診斷MASLD方面表現良好,並在便利性和多樣性上具優勢。 PubMed DOI

這項研究評估了ChatGPT在泌尿科醫學影像解讀的有效性,特別是CT和MRI影像。結果顯示,ChatGPT在14%的CT和28%的MRI案例中準確識別首要診斷,雖然無顯著差異,但加入器官指導後,CT影像的準確率提升了18%。整體來看,雖然ChatGPT的初步有效性有限,但在用戶指導下,其表現可顯著改善,顯示AI在臨床應用中的潛力與限制。 PubMed DOI

這項研究探討大型語言模型(LLMs)與對比增強超聲肝臟影像報告系統(CEUS LI-RADS)結合,對高風險患者診斷小型肝細胞癌(sHCC)的效果。研究涵蓋403名未治療的高風險患者,評估的LLMs包括ChatGPT-4.0等。結果顯示,ChatGPT-4.0在CEUS LI-RADS分類上表現優於其他模型,且在檢測sHCC的敏感性上也優於ChatGPT-4o。整體而言,研究建議ChatGPT-4.0結合CEUS LI-RADS,可能成為診斷sHCC的有效工具。 PubMed DOI

本研究評估了ChatGPT 4.0根據ACR-TI-RADS 2017標準解讀甲狀腺超音波報告的能力,並與醫療專家及一名缺乏經驗的使用者進行比較。結果顯示,ChatGPT在回聲焦點的評估上與專家一致,但在其他標準上則有不一致。缺乏經驗的使用者表現優於ChatGPT,顯示傳統醫學訓練的重要性。結論指出,ChatGPT可作為輔助診斷工具,但無法取代人類專業知識,並建議改善AI算法以增強其臨床實用性。 PubMed DOI

這項研究發現,ChatGPT-4-vision 能用數位肝臟切片影像判讀MASH肝纖維化分期,表現接近專業病理醫師。給予範例影像後,準確率最高達88%,尤其在辨識晚期纖維化(F4)更突出。分期結果也和膠原蛋白測量高度相關,顯示大型語言模型有潛力協助病理診斷。 PubMed DOI

這項研究發現,ChatGPT-4o在診斷肝臟局部病灶時,表現大致和資淺放射科醫師差不多,但還是比不上有經驗的醫師。把ChatGPT-4o加入診斷流程,也沒明顯提升醫師的診斷表現。總結來說,目前大型語言模型對診斷這類疾病的幫助有限,準確度還有待加強。 PubMed DOI

研究發現,ChatGPT-4.0在判讀肌肉骨骼腫瘤影像時,主要診斷正確率低於人類專家(44%比87%),但若加上次要診斷,差距縮小(71%比94%)。雖然準確度還不及專家,但因為速度快又隨時可用,未來有機會成為放射科的輔助工具。 PubMed DOI

這項回溯性研究發現,ChatGPT-4在解讀乳房超音波報告並用BI-RADS分類結節時,表現比資淺放射科醫師更好,和資深醫師差不多。它預測惡性腫瘤的準確度高(AUC 0.82,準確率80.63%,敏感度90.56%,特異度73.51%)。若把ChatGPT-4納入影像判讀流程,能進一步提升醫師診斷準確率,減少不同醫師間的判讀差異。 PubMed DOI