原始文章

這項研究評估了GPT-4O在識別異常血細胞形態的表現,結果顯示其準確率為70%,遠低於血液科醫生的95.42%。在外周血塗片中,GPT-4O的準確率為77.14%,但在骨髓塗片中僅為62.86%。雖然它能識別某些內含物,但對於碎裂紅血球的分類及細胞內顆粒的識別仍有困難。總體來看,GPT-4O目前尚不及人類專家,未來需改進算法並擴大數據集,以提升診斷準確性。 PubMed DOI


站上相關主題文章列表

研究發現GPT-4在組織病理圖像中檢測結腸腺瘤的準確性,與病理醫師比較後,顯示敏感性為74%,特異性為36%。對於腺瘤檢測表現不錯,但在分類上有些差異。一致性稍嫌不足,顯示GPT-4仍有限制,強調病理醫師的專業知識和臨床經驗的重要性。 PubMed DOI

最新的ChatGPT-4生成式人工智慧技術在血液學診斷方面有重要進展,特別在辨識血細胞方面表現優異,尤其在辨識異常細胞時的準確率超過54%。雖然有潛力成為臨床診斷工具,但仍需進一步提升準確性,無法完全取代專業判斷。這項研究強調生成式人工智慧在血液形態學領域的應用價值,為未來研究奠定基礎。 PubMed DOI

研究指出GPT-4在分析甲狀腺癌超音波報告方面表現優異,但在準確診斷上有限制。透過"Chain of Thought"方法增加可解釋性,強調人工智慧表現差異。GPT-4或許可成為醫療工具,特別是生成診斷報告。提出"ThyroAIGuide"線上平台展現人工智慧潛力,但需進一步研究和醫療專業監控,確保患者安全和護理品質。 PubMed DOI

研究比較了OpenAI的GPT-4與人類專家在心臟病學建議的醫學準確性。結果發現,GPT-4和人類專家在醫學準確性上差不多,人類專家在高準確性回答上表現較好,但也有更多低準確性回答。GPT-4回答較長,用詞較少多樣,可能有助於一般人理解。然而,人類專家在藥物資訊和初步診斷等特定問題上表現更好,顯示GPT-4在臨床判斷上有限。雖然GPT-4在自動醫學諮詢有潛力,但需改進整合臨床推理,確保安全使用。進一步研究探索大型語言模型在醫學領域的潛力是必要的。 PubMed DOI

這項研究比較了GPT-4和經驗豐富的醫生在診斷臨床案例的準確性。對於未發表的挑戰性案例,GPT-4的前六個診斷準確率達61.1%,超過醫生的49.1%。在常見情境中,GPT-4的前三個診斷100%正確,而醫生則為84.3%。這顯示GPT-4在內科表現上至少與經驗醫生相當,甚至更佳,特別是在挑戰性案例中。不過,對常見案例的高準確率可能與這些案例是模型訓練數據的一部分有關。 PubMed DOI

這項研究探討了GPT-4在協助懷疑心肌炎的醫療決策中的有效性,分析了396名患者的心臟MRI報告。結果顯示,GPT-4的準確率為83%,敏感度90%,特異度78%。其表現與一位有一年經驗的放射科醫師相當,但低於經驗更豐富的醫師。當報告中包含T1和T2映射序列時,GPT-4和人類醫師的表現都有所提升。這顯示GPT-4可能成為經驗較少醫師的有用診斷輔助工具,但仍需進一步研究以了解其潛力。 PubMed DOI

這項研究評估了GPT-4(特別是ChatGPT)在解讀腦腫瘤MRI報告的診斷能力。研究分析了150份術前病患的報告,結果顯示GPT-4的診斷準確率為73%,而神經放射科醫師則為80%。在鑑別診斷方面,GPT-4的準確率高達94%,放射科醫師則介於73%到89%之間。研究結果表明,GPT-4可作為神經放射科醫師的有用第二意見,並能成為一般放射科醫師和住院醫師的指導工具,顯示其在臨床診斷中的潛力。 PubMed DOI

這項研究評估了多模態人工智慧模型 GPT-4V 在解讀放射影像的表現,包括超音波、電腦斷層掃描和 X 光。分析230張急診影像後,模型在影像識別上達到100%準確率,但在解剖和病理識別上表現不佳,尤其是病理識別僅35.2%。儘管有潛力,GPT-4V 的診斷錯誤率超過40%,引發臨床使用的可靠性擔憂。研究強調需進一步開發以提升準確性,確保病人安全,並指出目前不宜作為獨立診斷工具。 PubMed DOI

這項研究評估了ChatGPT在診斷結腸癌的能力,特別是比較GPT-3.5和GPT-4.0的表現。研究分析了286份腸癌病例,結果顯示GPT-4.0在初診和次診的準確率均高於GPT-3.5,分別為0.972對0.855和0.908對0.617。雖然GPT-4.0在處理病史和實驗室數據上有所改善,但在識別症狀方面仍有挑戰。整體而言,GPT-4.0在臨床輔助診斷中展現出潛力,但仍需進一步研究以克服其限制。 PubMed DOI

這項研究探討了OpenAI的GPT-4進階數據分析(ADA)在分析重症監護病房病人胸部X光片的有效性。研究使用了43,788份病人報告,要求GPT-4進行多種分析,包括繪圖和預測模型。三位具機器學習經驗的科學家評估了GPT-4的輸出,結果顯示其視覺化和統計分析大多準確,但也有錯誤。GPT-4的機器學習模型AUC為0.75,與人類模型相近(0.80),準確率也相似。研究建議大型語言模型可增強放射學數據分析,但仍需注意準確性限制。 PubMed DOI