原始文章

這項研究探討了OpenAI的GPT-4進階數據分析(ADA)在分析重症監護病房病人胸部X光片的有效性。研究使用了43,788份病人報告,要求GPT-4進行多種分析,包括繪圖和預測模型。三位具機器學習經驗的科學家評估了GPT-4的輸出,結果顯示其視覺化和統計分析大多準確,但也有錯誤。GPT-4的機器學習模型AUC為0.75,與人類模型相近(0.80),準確率也相似。研究建議大型語言模型可增強放射學數據分析,但仍需注意準確性限制。 PubMed DOI


站上相關主題文章列表

這項研究探討了GPT-4在協助懷疑心肌炎的醫療決策中的有效性,分析了396名患者的心臟MRI報告。結果顯示,GPT-4的準確率為83%,敏感度90%,特異度78%。其表現與一位有一年經驗的放射科醫師相當,但低於經驗更豐富的醫師。當報告中包含T1和T2映射序列時,GPT-4和人類醫師的表現都有所提升。這顯示GPT-4可能成為經驗較少醫師的有用診斷輔助工具,但仍需進一步研究以了解其潛力。 PubMed DOI

人工智慧(AI)在醫療,特別是放射學的發展,正帶來重大變革,提升診斷準確性和病人參與度。大型語言模型(LLMs),如GPT-4,能協助撰寫和總結放射報告,支持鑑別診斷,並建議基於證據的治療方案。本文探討了GPT-4在提升診斷精確度和報告效率的應用,同時也提到實施AI技術所面臨的倫理和隱私挑戰,強調需謹慎監督和遵循法規。最終,這些技術有望改善病人照護和臨床研究。 PubMed DOI

這項研究評估了多模態人工智慧模型 GPT-4V 在解讀放射影像的表現,包括超音波、電腦斷層掃描和 X 光。分析230張急診影像後,模型在影像識別上達到100%準確率,但在解剖和病理識別上表現不佳,尤其是病理識別僅35.2%。儘管有潛力,GPT-4V 的診斷錯誤率超過40%,引發臨床使用的可靠性擔憂。研究強調需進一步開發以提升準確性,確保病人安全,並指出目前不宜作為獨立診斷工具。 PubMed DOI

這項研究評估了GPT-4o在歐洲放射學委員會考試中的表現,結果顯示它在選擇題和短案例問題上超過了平均放射科醫生的分數(70.2%對58.4%)。不過,在臨床推理部分,GPT-4o的得分低於平均及及格分數(52.9%對66.1%)。該模型在超聲影像問題上表現優異(87.5-100%),但在影片問題上則較差(50.6%)。整體來看,這項研究顯示大型語言模型如GPT-4o在協助放射科醫生方面的潛力。 PubMed DOI

這項研究評估了具備視覺能力的AI模型GPT-4V在解讀放射影像的表現,並與放射科醫師及住院醫師進行比較。研究涵蓋72個放射案例,結果顯示GPT-4V的整體準確率為43%。在影像和非影像依賴的案例中,醫師的表現並未顯著優於GPT-4V。特別是,GPT-4V在僅使用文字輸入時的準確率較高(50%),而僅使用影像輸入則為38%。總體來看,GPT-4V的表現與人類相當,且未能提升人類的解讀準確性。 PubMed DOI

這項研究評估了GPT-4在神經放射學中生成鑑別診斷的效果,並與專業神經放射科醫師進行比較。研究分析了60份報告,結果顯示GPT-4在61.7%的案例中正確包含實際診斷,而醫師的準確率在63.3%到73.3%之間。GPT-4與醫師的協議程度被評為公平到中等。雖然GPT-4在輔助放射學工作上顯示潛力,但準確性仍不及人類專家,這強調了了解其局限性的重要性。 PubMed DOI

這項研究探討了GPT-4的進階數據分析(ADA)套件在自動創建機器學習模型方面的表現,目的是預測膠質瘤的分子類型。研究使用了615名新診斷患者的MRI掃描數據,並比較了GPT-4與傳統手工模型的準確性。結果顯示,GPT-4在某些數據集上表現優異,但在不同膠質瘤類型的預測上仍面臨挑戰,特別是在IDH突變類型的準確性上。整體而言,GPT-4展現了自動開發機器學習模型的潛力,但也顯示出處理不平衡數據集的困難。 PubMed DOI

這項研究評估了GPT-4和GPT-4o在識別需進一步評估的胸部放射線報告的效果。研究分析了來自NIH的100個案例,結果顯示GPT-4o在敏感性、準確性和陰性預測值上均優於GPT-4,而GPT-4在特異性和陽性預測值上則表現更佳。總體來看,GPT-4o在臨床應用中顯示出良好的潛力。 PubMed DOI

這項研究探討了GPT-4在放射科報告中檢測和修正錯誤的潛力,特別針對頭部CT掃描。隨著放射科醫師的工作壓力增加,GPT-4在錯誤檢測方面表現優異,解釋性錯誤敏感度達84%,事實性錯誤敏感度達89%。相比之下,人類讀者的表現較差,檢查時間也較長。雖然GPT-4在識別錯誤時有些假陽性,但仍顯示出其在減輕醫師負擔和提升準確度的潛力,值得在臨床實踐中進一步探索。 PubMed DOI

這項研究探討了使用ChatGPT 4.0搭配「X-Ray Interpreter」來解讀急診胸部X光片。分析了1,400張來自NIH的影像,涵蓋七種病理類別。ChatGPT在識別正常X光片方面表現優異,敏感度達98.9%,特異度93.9%。對於肺炎和氣胸的診斷表現較好,但在肺不張和肺氣腫上則較差。總體來看,ChatGPT作為輔助診斷工具顯示潛力,但對於更細微的診斷仍需改進,未來可與專業影像識別模型整合以提升能力。 PubMed DOI