原始文章

這項研究評估了GPT-4和GPT-4o在根據TI-RADS指引識別甲狀腺結節特徵的表現,使用了202張超音波影像。結果顯示,GPT-4在大多數類別中具高特異性但低敏感性,對低風險結節的敏感性僅25%,而高風險結節的敏感性為75%。雖然在識別平滑邊緣方面表現較好,但在其他特徵上則不理想。整體來看,這些模型在臨床應用前仍需改進和驗證。 PubMed DOI


站上相關主題文章列表

研究使用ChatGPT進行甲狀腺結節風險評估,顯示在預測惡性風險方面有一定潛力,但仍需更多研究驗證臨床應用。整合ChatGPT到臨床工作流程中,有助於提升甲狀腺結節風險評估和病人護理的效果。 PubMed DOI

透過ChatGPT的協助,我們成功開發了一個深度學習模型,用來分析甲狀腺結節的超音波影像和細針穿刺活檢(FNAB)結果。研究共有1,061位參與者,模型在測試中達到0.81的準確度,對良性和惡性甲狀腺病理的區分表現出高精確度和召回率,平衡的F1分數為0.86。這研究顯示了人工智慧,包括ChatGPT,在醫學影像分析深度學習模型上的潛力。 PubMed DOI

研究指出GPT-4在分析甲狀腺癌超音波報告方面表現優異,但在準確診斷上有限制。透過"Chain of Thought"方法增加可解釋性,強調人工智慧表現差異。GPT-4或許可成為醫療工具,特別是生成診斷報告。提出"ThyroAIGuide"線上平台展現人工智慧潛力,但需進一步研究和醫療專業監控,確保患者安全和護理品質。 PubMed DOI

研究發現使用ChatGPT-4.0生成甲狀腺超聲報告比ChatGPT-3.5更準確且一致,尤其在區分結節和提供管理建議方面表現較佳。結果顯示ChatGPT有潛力將自由文本報告轉換為結構化格式。 PubMed DOI

這項研究探討了大型語言模型(LLMs),特別是ChatGPT-4o和Claude 3-Opus,在超音波影像中分類甲狀腺結節的表現。研究涵蓋112位患者的116個結節,結果顯示ChatGPT-4o的Kappa值為0.116,Claude 3-Opus更低,僅0.034,而初級放射科醫師的Kappa值為0.450,顯示中等協議。ROC曲線方面,ChatGPT-4o的AUC為57.0%,Claude 3-Opus為52.0%,醫師則為72.4%。兩個LLM的不必要活檢率也高,分別為41.4%和43.1%,醫師僅12.1%。這顯示LLMs在醫學影像的診斷準確性仍有限,需謹慎使用。 PubMed DOI

這項研究評估了ChatGPT-4和ChatGPT-4o在乳腺癌影像報告及BI-RADS分數生成的有效性。研究使用了77張來自radiopaedia.org的影像,包含乳房X光和超音波,並在不同會議中進行評估以避免偏見。結果顯示,兩個模型在BI-RADS評分的準確率為66.2%,在BI-RADS 5案例中表現最佳(ChatGPT-4為84.4%,ChatGPT-4o為88.9%)。不過,它們在BI-RADS 1-3案例中常常給予過高的嚴重性評分,顯示目前大型語言模型在乳腺影像評估上的局限性,需進一步研究才能整合進臨床實踐。 PubMed DOI

這項研究評估了OpenAI開發的GPT-4在病理影像分析中的診斷準確性。研究涵蓋16個器官的44張組織病理影像及100張結直腸活檢顯微照片。GPT-4在腫瘤類型和組織來源的整體準確率為0.64,結腸息肉的分類準確率介於0.57到0.75之間。它在區分低級別和高級別不典型增生方面表現良好,準確率達0.88,對腺癌檢測的敏感性也很高。整體來看,GPT-4的表現與病理住院醫師相當,顯示其作為輔助工具的潛力。 PubMed DOI

本研究評估了ChatGPT 4.0根據ACR-TI-RADS 2017標準解讀甲狀腺超音波報告的能力,並與醫療專家及一名缺乏經驗的使用者進行比較。結果顯示,ChatGPT在回聲焦點的評估上與專家一致,但在其他標準上則有不一致。缺乏經驗的使用者表現優於ChatGPT,顯示傳統醫學訓練的重要性。結論指出,ChatGPT可作為輔助診斷工具,但無法取代人類專業知識,並建議改善AI算法以增強其臨床實用性。 PubMed DOI

這項研究評估了GPT-4o在識別ACR TIRADS超音波報告錯誤的有效性及其加速報告生成的能力。分析了福建醫科大學第二附屬醫院的200份甲狀腺超音波報告,結果顯示GPT-4o成功檢測到90%的錯誤,接近資深醫師的93%。在效率上,GPT-4o的審查速度明顯快於醫師,平均只需0.79小時,而醫師則需1.8到3.1小時。研究結果顯示,GPT-4o不僅在錯誤檢測上表現優異,還能顯著提升報告處理效率,對於改善診斷準確性及支持住院醫師非常有幫助。 PubMed DOI

這項研究評估了GPT-4在超音波影像識別甲狀腺結節的表現,並與住院醫師進行比較。分析了1,145張影像,結果顯示GPT-4對惡性結節的正確識別率為58.07%,良性結節為66.86%;而住院醫師則分別為73.89%和74.66%。在統計上,GPT-4的準確性顯著低於醫師,尤其是對小於1公分的結節。總體來看,GPT-4在甲狀腺結節分類上有潛力,但仍需改進。 PubMed DOI