原始文章

這項研究探討了GPT-4在識別日本放射學報告中胰臟癌的TNM分級的效果。研究分析了2020年4月至2022年6月的100份CT掃描報告,結果顯示GPT-4在T分類的準確率為73%,N分類91%,M分類93%。與兩位經驗豐富的放射科醫生的協議程度分別為T的0.45、N的0.79和M的0.83。雖然GPT-4對TNM分級有一定了解,但在這個特定情境下的表現仍被認為不足。 PubMed DOI


站上相關主題文章列表

研究比較了GPT-3.5和GPT-4在日本醫師執照考試(JMLE)中的表現,結果顯示GPT-4比GPT-3.5更準確,尤其在各種問題上表現更好。GPT-4在困難和特定疾病問題上也表現出色,符合JMLE的及格標準。這顯示GPT-4可能成為非英語國家醫學教育和臨床支援的實用工具。 PubMed DOI

研究比較了GPT模型和放射科醫師生成放射學報告的表現,結果顯示GPT-4在準確性上優於GPT-2和GPT-3.5,但仍不及醫師。醫師在印象和鑑別診斷方面表現較佳。GPT-3.5和GPT-4生成的報告可讀性高,但準確性仍需醫師驗證。 PubMed DOI

研究發現,比較放射科醫師和GPT-4 AI生成的放射學報告,發現兩者在質量和內容上相當,但AI報告更為簡潔,且結構稍有不同。這顯示GPT-4可能是一個可靠的工具,有助於提升臨床效率和溝通。然而,仍需解決道德問題和限制,以確保安全實施。 PubMed DOI

研究發現GPT-4在組織病理圖像中檢測結腸腺瘤的準確性,與病理醫師比較後,顯示敏感性為74%,特異性為36%。對於腺瘤檢測表現不錯,但在分類上有些差異。一致性稍嫌不足,顯示GPT-4仍有限制,強調病理醫師的專業知識和臨床經驗的重要性。 PubMed DOI

這項研究評估了大型語言模型GPT-4在辨識放射學報告中的錯誤方面的效果。結果顯示,GPT-4在檢測錯誤方面表現與放射科醫師相似,並且每份報告所需的時間更少,成本效益更高。這意味著GPT-4有助於減少放射學報告生成的工時和成本。 PubMed DOI

像GPT-4這樣的大型語言模型(LLMs)可以自動從原始的自由文本報告中高精度地生成胰臟導管腺癌(PDAC)的結構化摘要報告。GPT-4在創建摘要報告和分類腫瘤可切除性方面優於GPT-3.5。外科醫生使用人工智慧生成的報告比原始報告更準確和高效地確定可切除性。 PubMed DOI

這項研究探討了GPT-4在協助懷疑心肌炎的醫療決策中的有效性,分析了396名患者的心臟MRI報告。結果顯示,GPT-4的準確率為83%,敏感度90%,特異度78%。其表現與一位有一年經驗的放射科醫師相當,但低於經驗更豐富的醫師。當報告中包含T1和T2映射序列時,GPT-4和人類醫師的表現都有所提升。這顯示GPT-4可能成為經驗較少醫師的有用診斷輔助工具,但仍需進一步研究以了解其潛力。 PubMed DOI

這項研究評估了GPT-4(特別是ChatGPT)在解讀腦腫瘤MRI報告的診斷能力。研究分析了150份術前病患的報告,結果顯示GPT-4的診斷準確率為73%,而神經放射科醫師則為80%。在鑑別診斷方面,GPT-4的準確率高達94%,放射科醫師則介於73%到89%之間。研究結果表明,GPT-4可作為神經放射科醫師的有用第二意見,並能成為一般放射科醫師和住院醫師的指導工具,顯示其在臨床診斷中的潛力。 PubMed DOI

這項研究比較了ChatGPT大型語言模型(LLMs)與不同經驗的人類讀者在肺癌分期的表現。研究納入700名非小細胞肺癌患者,使用胸部CT和FDG PET/CT報告進行分析。結果顯示,GPT-4o的準確率為74.1%,優於其他模型和一位住院醫師,但仍低於專科訓練的放射科醫生。這表明,雖然LLMs在某些方面表現不錯,但在癌症分期等複雜任務中,專業醫療人員的角色仍然不可或缺。 PubMed DOI

這項研究評估了ChatGPT在診斷結腸癌的能力,特別是比較GPT-3.5和GPT-4.0的表現。研究分析了286份腸癌病例,結果顯示GPT-4.0在初診和次診的準確率均高於GPT-3.5,分別為0.972對0.855和0.908對0.617。雖然GPT-4.0在處理病史和實驗室數據上有所改善,但在識別症狀方面仍有挑戰。整體而言,GPT-4.0在臨床輔助診斷中展現出潛力,但仍需進一步研究以克服其限制。 PubMed DOI