Preliminary assessment of automated radiology report generation with generative pre-trained transformers: comparing results to radiologist-generated reports.
利用生成式預訓練轉換器進行自動放射學報告生成的初步評估：與放射科醫師生成的報告進行比較。 Jpn J Radiol 2024-02-06

研究比較了GPT模型和放射科醫師生成放射學報告的表現，結果顯示GPT-4在準確性上優於GPT-2和GPT-3.5，但仍不及醫師。醫師在印象和鑑別診斷方面表現較佳。GPT-3.5和GPT-4生成的報告可讀性高，但準確性仍需醫師驗證。 PubMed DOI

Evaluating the performance of Generative Pre-trained Transformer-4 (GPT-4) in standardizing radiology reports.
評估 Generative Pre-trained Transformer-4 (GPT-4) 在標準化放射學報告中的表現。 Eur Radiol 2023-11-08

研究發現，比較放射科醫師和GPT-4 AI生成的放射學報告，發現兩者在質量和內容上相當，但AI報告更為簡潔，且結構稍有不同。這顯示GPT-4可能是一個可靠的工具，有助於提升臨床效率和溝通。然而，仍需解決道德問題和限制，以確保安全實施。 PubMed DOI

Generative pretrained transformer-4, an artificial intelligence text predictive model, has a high capability for passing novel written radiology exam questions.
生成預訓練轉換器-4（GPT-4）是一種人工智慧文本預測模型，具有高度能力通過新穎的放射學考試問題。 Int J Comput Assist Radiol Surg 2024-03-29

卷積神經網路在放射學影像解讀方面的能力越來越強。大型語言模型如GPT-3和GPT-4已在放射學考試中取得高準確率，且GPT-4表現更優。研究正探索這些人工智慧模型在臨床放射學應用的可能性。 PubMed DOI

Potential of GPT-4 for Detecting Errors in Radiology Reports: Implications for Reporting Accuracy.
GPT-4在檢測放射學報告錯誤方面的潛力：對報告準確性的影響。 Radiology 2024-04-16

這項研究評估了大型語言模型GPT-4在辨識放射學報告中的錯誤方面的效果。結果顯示，GPT-4在檢測錯誤方面表現與放射科醫師相似，並且每份報告所需的時間更少，成本效益更高。這意味著GPT-4有助於減少放射學報告生成的工時和成本。 PubMed DOI

Towards Improved Radiological Diagnostics: Investigating the Utility and Limitations of GPT-3.5 Turbo and GPT-4 with Quiz Cases.
探討改進放射學診斷：研究 GPT-3.5 Turbo 和 GPT-4 的效用和限制，並使用測驗案例。 AJNR Am J Neuroradiol 2024-05-08

研究使用GPT-3.5 Turbo和GPT-4等語言模型在神經放射學案例上進行診斷，結果顯示在不同任務上有不同表現。結合案例搜尋和直接診斷可提升GPT-3.5 Turbo表現，但整體仍有改進空間，需注意模型限制。結果顯示這些模型在特定情況下可作為輔助診斷工具。 PubMed DOI

Leveraging Professional Radiologists' Expertise to Enhance LLMs' Evaluation for Radiology Reports.
善用專業放射科醫師的專業知識，以提升對放射學報告的LLM評估。 ArXiv 2024-06-21

人工智慧在放射學報告生成方面有進步，但評估AI報告仍有挑戰。結合放射科醫師專業知識與GPT-3.5、GPT-4等大型語言模型，使用ICIL和CoT推理對齊評估標準。透過回歸模型聚合分數進行比較，實驗結果顯示此方法優於現有指標。穩健性已驗證，將釋出專家註釋以增進AI醫學報告評估品質。 PubMed DOI

Optimizing GPT-4 Turbo Diagnostic Accuracy in Neuroradiology through Prompt Engineering and Confidence Thresholds.
透過提示工程和信心閾值優化 GPT-4 Turbo 在神經放射學中的診斷準確性。 Diagnostics (Basel) 2024-07-27

這項研究分析了大型語言模型（LLMs），特別是GPT-4 Turbo，在神經放射學的應用，針對30-50%的高誤診率進行探討。透過分析751個案例，研究發現透過提示工程和設定90%的信心閾值，GPT-4 Turbo的診斷準確率從55.1%提升至72.9%。候選診斷的正確率達85.9%，誤診率降至14.1%。雖然這些方法顯著提高了準確性，但也限制了模型的處理案例數量。未來仍需進一步研究，以優化這些策略，確保在臨床應用中的準確性與實用性。 PubMed DOI

From Revisions to Insights: Converting Radiology Report Revisions into Actionable Educational Feedback Using Generative AI Models.
從修訂到洞察：利用生成式 AI 模型將放射學報告修訂轉化為可行的教育反饋。 J Imaging Inform Med 2024-08-19

這項研究顯示生成式人工智慧，特別是OpenAI的GPT-4 Turbo API，在提升放射學訓練方面的潛力。研究發現，這個AI模型能檢測到的差異明顯多於專業放射科醫師，顯示其在傳統審查中可能被忽略的改進空間。雖然AI在差異檢測上表現優異，但在評分一致性上仍有改進空間。生成的教學要點在85%的案例中被認為適當，顯示其教育價值。未來研究可著重於提高模型準確性及評分者一致性，並探討AI反饋對實習生的長期影響。 PubMed DOI

Advancing radiology with GPT-4: Innovations in clinical applications, patient engagement, research, and learning.
以 GPT-4 推進放射學：臨床應用、病患參與、研究與學習的創新。 Eur J Radiol Open 2024-08-22

人工智慧（AI）在醫療，特別是放射學的發展，正帶來重大變革，提升診斷準確性和病人參與度。大型語言模型（LLMs），如GPT-4，能協助撰寫和總結放射報告，支持鑑別診斷，並建議基於證據的治療方案。本文探討了GPT-4在提升診斷精確度和報告效率的應用，同時也提到實施AI技術所面臨的倫理和隱私挑戰，強調需謹慎監督和遵循法規。最終，這些技術有望改善病人照護和臨床研究。 PubMed DOI

Evaluating GPT-4o's Performance in the Official European Board of Radiology Exam: A Comprehensive Assessment.
評估 GPT-4o 在歐洲放射學官方考試中的表現：全面評估。 Acad Radiol 2024-09-18

這項研究評估了GPT-4o在歐洲放射學委員會考試中的表現，結果顯示它在選擇題和短案例問題上超過了平均放射科醫生的分數（70.2%對58.4%）。不過，在臨床推理部分，GPT-4o的得分低於平均及及格分數（52.9%對66.1%）。該模型在超聲影像問題上表現優異（87.5-100%），但在影片問題上則較差（50.6%）。整體來看，這項研究顯示大型語言模型如GPT-4o在協助放射科醫生方面的潛力。 PubMed DOI

原始文章

站上相關主題文章列表