原始文章

這項研究探討了OpenAI的GPT-4進階數據分析(ADA)在分析重症監護病房病人胸部X光片的有效性。研究使用了43,788份病人報告,要求GPT-4進行多種分析,包括繪圖和預測模型。三位具機器學習經驗的科學家評估了GPT-4的輸出,結果顯示其視覺化和統計分析大多準確,但也有錯誤。GPT-4的機器學習模型AUC為0.75,與人類模型相近(0.80),準確率也相似。研究建議大型語言模型可增強放射學數據分析,但仍需注意準確性限制。 PubMed DOI


站上相關主題文章列表

卷積神經網路在放射學影像解讀方面的能力越來越強。大型語言模型如GPT-3和GPT-4已在放射學考試中取得高準確率,且GPT-4表現更優。研究正探索這些人工智慧模型在臨床放射學應用的可能性。 PubMed DOI

研究評估OpenAI的GPT-4V在生成真實世界胸部X光片的放射學結果能力。透過分析100張有放射學報告的X光片,建立參考標準。結果顯示,雖然在少樣本學習中有改進,但GPT-4V在解釋真實世界X光片方面效果有限。 PubMed DOI

研究使用GPT-3.5 Turbo和GPT-4等語言模型在神經放射學案例上進行診斷,結果顯示在不同任務上有不同表現。結合案例搜尋和直接診斷可提升GPT-3.5 Turbo表現,但整體仍有改進空間,需注意模型限制。結果顯示這些模型在特定情況下可作為輔助診斷工具。 PubMed DOI

這項研究探討了GPT-4在協助懷疑心肌炎的醫療決策中的有效性,分析了396名患者的心臟MRI報告。結果顯示,GPT-4的準確率為83%,敏感度90%,特異度78%。其表現與一位有一年經驗的放射科醫師相當,但低於經驗更豐富的醫師。當報告中包含T1和T2映射序列時,GPT-4和人類醫師的表現都有所提升。這顯示GPT-4可能成為經驗較少醫師的有用診斷輔助工具,但仍需進一步研究以了解其潛力。 PubMed DOI

人工智慧(AI)在醫療,特別是放射學的發展,正帶來重大變革,提升診斷準確性和病人參與度。大型語言模型(LLMs),如GPT-4,能協助撰寫和總結放射報告,支持鑑別診斷,並建議基於證據的治療方案。本文探討了GPT-4在提升診斷精確度和報告效率的應用,同時也提到實施AI技術所面臨的倫理和隱私挑戰,強調需謹慎監督和遵循法規。最終,這些技術有望改善病人照護和臨床研究。 PubMed DOI

這項研究評估了多模態人工智慧模型 GPT-4V 在解讀放射影像的表現,包括超音波、電腦斷層掃描和 X 光。分析230張急診影像後,模型在影像識別上達到100%準確率,但在解剖和病理識別上表現不佳,尤其是病理識別僅35.2%。儘管有潛力,GPT-4V 的診斷錯誤率超過40%,引發臨床使用的可靠性擔憂。研究強調需進一步開發以提升準確性,確保病人安全,並指出目前不宜作為獨立診斷工具。 PubMed DOI

這項研究評估了具備視覺能力的AI模型GPT-4V在解讀放射影像的表現,並與放射科醫師及住院醫師進行比較。研究涵蓋72個放射案例,結果顯示GPT-4V的整體準確率為43%。在影像和非影像依賴的案例中,醫師的表現並未顯著優於GPT-4V。特別是,GPT-4V在僅使用文字輸入時的準確率較高(50%),而僅使用影像輸入則為38%。總體來看,GPT-4V的表現與人類相當,且未能提升人類的解讀準確性。 PubMed DOI

這項研究探討了GPT-4的進階數據分析(ADA)套件在自動創建機器學習模型方面的表現,目的是預測膠質瘤的分子類型。研究使用了615名新診斷患者的MRI掃描數據,並比較了GPT-4與傳統手工模型的準確性。結果顯示,GPT-4在某些數據集上表現優異,但在不同膠質瘤類型的預測上仍面臨挑戰,特別是在IDH突變類型的準確性上。整體而言,GPT-4展現了自動開發機器學習模型的潛力,但也顯示出處理不平衡數據集的困難。 PubMed DOI

這項研究評估了GPT-4和GPT-4o在識別需進一步評估的胸部放射線報告的效果。研究分析了來自NIH的100個案例,結果顯示GPT-4o在敏感性、準確性和陰性預測值上均優於GPT-4,而GPT-4在特異性和陽性預測值上則表現更佳。總體來看,GPT-4o在臨床應用中顯示出良好的潛力。 PubMed DOI

這項研究探討了GPT-4在放射科報告中檢測和修正錯誤的潛力,特別針對頭部CT掃描。隨著放射科醫師的工作壓力增加,GPT-4在錯誤檢測方面表現優異,解釋性錯誤敏感度達84%,事實性錯誤敏感度達89%。相比之下,人類讀者的表現較差,檢查時間也較長。雖然GPT-4在識別錯誤時有些假陽性,但仍顯示出其在減輕醫師負擔和提升準確度的潛力,值得在臨床實踐中進一步探索。 PubMed DOI