Preliminary assessment of automated radiology report generation with generative pre-trained transformers: comparing results to radiologist-generated reports.
利用生成式預訓練轉換器進行自動放射學報告生成的初步評估：與放射科醫師生成的報告進行比較。 Jpn J Radiol 2024-02-06

研究比較了GPT模型和放射科醫師生成放射學報告的表現，結果顯示GPT-4在準確性上優於GPT-2和GPT-3.5，但仍不及醫師。醫師在印象和鑑別診斷方面表現較佳。GPT-3.5和GPT-4生成的報告可讀性高，但準確性仍需醫師驗證。 PubMed DOI

Potential of GPT-4 for Detecting Errors in Radiology Reports: Implications for Reporting Accuracy.
GPT-4在檢測放射學報告錯誤方面的潛力：對報告準確性的影響。 Radiology 2024-04-16

這項研究評估了大型語言模型GPT-4在辨識放射學報告中的錯誤方面的效果。結果顯示，GPT-4在檢測錯誤方面表現與放射科醫師相似，並且每份報告所需的時間更少，成本效益更高。這意味著GPT-4有助於減少放射學報告生成的工時和成本。 PubMed DOI

Evaluation of GPT-4 ability to identify and generate patient instructions for actionable incidental radiology findings.
評估 GPT-4 辨識和生成可執行的偶發性放射學發現患者指示的能力。 J Am Med Inform Assoc 2024-05-23

研究評估符合HIPAA標準的GPT-4在急診放射學報告中的效用。人工智慧在辨識重要發現方面表現良好，但仍需人類監督。總結來說，AI對於辨識病人放射學報告中的重要資訊有幫助，但人類的角色仍然不可或缺。 PubMed DOI

From Revisions to Insights: Converting Radiology Report Revisions into Actionable Educational Feedback Using Generative AI Models.
從修訂到洞察：利用生成式 AI 模型將放射學報告修訂轉化為可行的教育反饋。 J Imaging Inform Med 2024-08-19

這項研究顯示生成式人工智慧，特別是OpenAI的GPT-4 Turbo API，在提升放射學訓練方面的潛力。研究發現，這個AI模型能檢測到的差異明顯多於專業放射科醫師，顯示其在傳統審查中可能被忽略的改進空間。雖然AI在差異檢測上表現優異，但在評分一致性上仍有改進空間。生成的教學要點在85%的案例中被認為適當，顯示其教育價值。未來研究可著重於提高模型準確性及評分者一致性，並探討AI反饋對實習生的長期影響。 PubMed DOI

Comparative analysis of GPT-4-based ChatGPT's diagnostic performance with radiologists using real-world radiology reports of brain tumors.
基於 GPT-4 的 ChatGPT 與放射科醫生在腦腫瘤實際放射學報告中的診斷表現比較分析。 Eur Radiol 2024-08-28

這項研究評估了GPT-4（特別是ChatGPT）在解讀腦腫瘤MRI報告的診斷能力。研究分析了150份術前病患的報告，結果顯示GPT-4的診斷準確率為73%，而神經放射科醫師則為80%。在鑑別診斷方面，GPT-4的準確率高達94%，放射科醫師則介於73%到89%之間。研究結果表明，GPT-4可作為神經放射科醫師的有用第二意見，並能成為一般放射科醫師和住院醫師的指導工具，顯示其在臨床診斷中的潛力。 PubMed DOI

Evaluation of GPT Large Language Model Performance on RSNA 2023 Case of the Day Questions.
RSNA 2023 每日案例問題中 GPT 大型語言模型表現的評估。 Radiology 2024-10-01

這項研究評估了具備視覺能力的AI模型GPT-4V在解讀放射影像的表現，並與放射科醫師及住院醫師進行比較。研究涵蓋72個放射案例，結果顯示GPT-4V的整體準確率為43%。在影像和非影像依賴的案例中，醫師的表現並未顯著優於GPT-4V。特別是，GPT-4V在僅使用文字輸入時的準確率較高（50%），而僅使用影像輸入則為38%。總體來看，GPT-4V的表現與人類相當，且未能提升人類的解讀準確性。 PubMed DOI

Revolution or risk?-Assessing the potential and challenges of GPT-4V in radiologic image interpretation.
革命還是風險？- 評估 GPT-4V 在放射影像解讀中的潛力與挑戰。 Eur Radiol 2024-10-18

這項研究評估了ChatGPT-4 Vision在解讀臨床影像（如X光、CT、MRI等）的表現。分析了206個影像研究，結果顯示提供臨床上下文能顯著提高診斷準確率，從8.3%提升至29.1%和63.6%。但在30天和90天後重新評估時，準確率下降多達30%。雖然建議診斷與實際發現匹配率高達92.7%，但GPT-4V仍虛構了258個發現，並錯誤識別了65個案例。總體來看，GPT-4V目前無法可靠解讀放射影像，需進一步改進以確保病人安全。 PubMed DOI

The Treasure Trove Hidden in Plain Sight: The Utility of GPT-4 in Chest Radiograph Evaluation.
隱藏在明處的寶藏：GPT-4 在胸部X光評估中的實用性。 Radiology 2024-11-12

這項研究探討了OpenAI的GPT-4進階數據分析（ADA）在分析重症監護病房病人胸部X光片的有效性。研究使用了43,788份病人報告，要求GPT-4進行多種分析，包括繪圖和預測模型。三位具機器學習經驗的科學家評估了GPT-4的輸出，結果顯示其視覺化和統計分析大多準確，但也有錯誤。GPT-4的機器學習模型AUC為0.75，與人類模型相近（0.80），準確率也相似。研究建議大型語言模型可增強放射學數據分析，但仍需注意準確性限制。 PubMed DOI

Evaluating the Role of GPT-4 and GPT-4o in the Detectability of Chest Radiography Reports Requiring Further Assessment.
評估 GPT-4 和 GPT-4o 在需要進一步評估的胸部放射線報告可檢測性中的角色。 Cureus 2025-01-13

這項研究評估了GPT-4和GPT-4o在識別需進一步評估的胸部放射線報告的效果。研究分析了來自NIH的100個案例，結果顯示GPT-4o在敏感性、準確性和陰性預測值上均優於GPT-4，而GPT-4在特異性和陽性預測值上則表現更佳。總體來看，GPT-4o在臨床應用中顯示出良好的潛力。 PubMed DOI

An assessment of ChatGPT in error detection for thyroid ultrasound reports: A comparative study with ultrasound physicians.
對於甲狀腺超音波報告中錯誤檢測的 ChatGPT 評估：與超音波醫師的比較研究。 Digit Health 2025-03-17

這項研究評估了GPT-4o在識別ACR TIRADS超音波報告錯誤的有效性及其加速報告生成的能力。分析了福建醫科大學第二附屬醫院的200份甲狀腺超音波報告，結果顯示GPT-4o成功檢測到90%的錯誤，接近資深醫師的93%。在效率上，GPT-4o的審查速度明顯快於醫師，平均只需0.79小時，而醫師則需1.8到3.1小時。研究結果顯示，GPT-4o不僅在錯誤檢測上表現優異，還能顯著提升報告處理效率，對於改善診斷準確性及支持住院醫師非常有幫助。 PubMed DOI

原始文章

站上相關主題文章列表