Risk stratification of thyroid nodules: Assessing the suitability of ChatGPT for text-based analysis.
甲狀腺結節的風險分層：評估 ChatGPT 在基於文本的分析中的適用性。 Am J Otolaryngol 2024-03-15

研究使用ChatGPT進行甲狀腺結節風險評估，顯示在預測惡性風險方面有一定潛力，但仍需更多研究驗證臨床應用。整合ChatGPT到臨床工作流程中，有助於提升甲狀腺結節風險評估和病人護理的效果。 PubMed DOI

Evaluating ChatGPT-4V in chest CT diagnostics: a critical image interpretation assessment.
評估 ChatGPT-4V 在胸部 CT 診斷中的表現：一項關鍵影像解讀評估。 Jpn J Radiol 2024-06-12

研究評估了ChatGPT-4V在解讀COVID-19、NSCLC和對照組案例的胸部CT掃描的準確性。ChatGPT-4V整體準確率為56.76%，對不同情況的敏感性和特異性有所不同。模型在所有肺葉案例中表現最佳。研究強調了AI模型在放射學中的挑戰和改進領域，呼籲加強模型以提升醫療應用的可靠性。 PubMed DOI

Comparative analysis of GPT-4-based ChatGPT's diagnostic performance with radiologists using real-world radiology reports of brain tumors.
基於 GPT-4 的 ChatGPT 與放射科醫生在腦腫瘤實際放射學報告中的診斷表現比較分析。 Eur Radiol 2024-08-28

這項研究評估了GPT-4（特別是ChatGPT）在解讀腦腫瘤MRI報告的診斷能力。研究分析了150份術前病患的報告，結果顯示GPT-4的診斷準確率為73%，而神經放射科醫師則為80%。在鑑別診斷方面，GPT-4的準確率高達94%，放射科醫師則介於73%到89%之間。研究結果表明，GPT-4可作為神經放射科醫師的有用第二意見，並能成為一般放射科醫師和住院醫師的指導工具，顯示其在臨床診斷中的潛力。 PubMed DOI

Lung Cancer Staging Using Chest CT and FDG PET/CT Free-Text Reports: Comparison Among Three ChatGPT Large-Language Models and Six Human Readers of Varying Experience.
使用胸部 CT 和 FDG PET/CT 自由文本報告進行肺癌分期：三種 ChatGPT 大型語言模型與六位不同經驗的人工讀者之間的比較。 AJR Am J Roentgenol 2024-09-04

這項研究比較了ChatGPT大型語言模型（LLMs）與不同經驗的人類讀者在肺癌分期的表現。研究納入700名非小細胞肺癌患者，使用胸部CT和FDG PET/CT報告進行分析。結果顯示，GPT-4o的準確率為74.1%，優於其他模型和一位住院醫師，但仍低於專科訓練的放射科醫生。這表明，雖然LLMs在某些方面表現不錯，但在癌症分期等複雜任務中，專業醫療人員的角色仍然不可或缺。 PubMed DOI

Enhancing Oncological Surveillance Through Large Language Model-Assisted Analysis: A Comparative Study of GPT-4 and Gemini in Evaluating Oncological Issues From Serial Abdominal CT Scan Reports.
透過大型語言模型輔助分析增強腫瘤監測：GPT-4 與 Gemini 在評估連續腹部 CT 掃描報告中的腫瘤問題的比較研究。 Acad Radiol 2024-12-10

這項研究比較了兩個大型語言模型（LLMs），GPT-4 和 Gemini，在分析放射學報告以識別腫瘤問題的表現。研究涵蓋205名患者，結果顯示GPT-4在準確率、精確度、召回率和F1分數上均優於Gemini，特別是在腫瘤狀態的判斷上也更準確。這顯示出大型語言模型，尤其是GPT-4，在腫瘤監測方面的潛力。 PubMed DOI

Evaluation of ChatGPT 4.0 in Thoracic Imaging and Diagnostics.
ChatGPT 4.0 在胸部影像學和診斷中的評估。 Cureus 2024-12-16

最近，自然語言處理（NLP）在醫療領域的進展顯著，特別是在數據分析和診斷方面。OpenAI的ChatGPT 4.0被評估在胸部影像診斷的表現，整體準確率達84.9%。它在術語和診斷徵象上表現優異，重症監護和正常解剖的準確率分別為90%和80%。在病理問題上，平均準確率為89.1%，但在某些疾病如肺癌的表現較差。總體來看，ChatGPT 4.0顯示出潛力，但仍需進一步研究以提升其臨床應用的可靠性。 PubMed DOI

Evaluating ChatGPT's diagnostic potential for pathology images.
評估 ChatGPT 在病理影像診斷中的潛力。 Front Med (Lausanne) 2025-02-07

這項研究評估了OpenAI開發的GPT-4在病理影像分析中的診斷準確性。研究涵蓋16個器官的44張組織病理影像及100張結直腸活檢顯微照片。GPT-4在腫瘤類型和組織來源的整體準確率為0.64，結腸息肉的分類準確率介於0.57到0.75之間。它在區分低級別和高級別不典型增生方面表現良好，準確率達0.88，對腺癌檢測的敏感性也很高。整體來看，GPT-4的表現與病理住院醫師相當，顯示其作為輔助工具的潛力。 PubMed DOI

An Assessment of ChatGPT's Responses to Common Patient Questions About Lung Cancer Surgery: A Preliminary Clinical Evaluation of Accuracy and Relevance.
對於肺癌手術常見病患問題的 ChatGPT 回應評估：準初步臨床準確性和相關性的評價。 J Clin Med 2025-03-17

本研究評估了ChatGPT在回答有關肺癌手術的常見問題上的能力。專家小組對其十六個回答進行評估，結果顯示所有回答都令人滿意且基於證據，僅有少數需要小幅澄清。使用的語言也易於患者理解。結論是，ChatGPT能有效提供肺癌手術相關資訊，並可作為術前患者教育的有用工具。 PubMed DOI

Comparison of the accuracy of GPT-4 and resident physicians in differentiating benign and malignant thyroid nodules.
GPT-4 與住院醫師在區分良性與惡性甲狀腺結節準確性的比較。 Front Artif Intell 2025-03-20

這項研究評估了GPT-4在超音波影像識別甲狀腺結節的表現，並與住院醫師進行比較。分析了1,145張影像，結果顯示GPT-4對惡性結節的正確識別率為58.07%，良性結節為66.86%；而住院醫師則分別為73.89%和74.66%。在統計上，GPT-4的準確性顯著低於醫師，尤其是對小於1公分的結節。總體來看，GPT-4在甲狀腺結節分類上有潛力，但仍需改進。 PubMed DOI

ChatGPT-4's Accuracy in Estimating Thyroid Nodule Features and Cancer Risk from Ultrasound Images.
ChatGPT-4 在從超聲影像估計甲狀腺結節特徵和癌症風險方面的準確性。 Endocr Pract 2025-03-26

這項研究評估了GPT-4和GPT-4o在根據TI-RADS指引識別甲狀腺結節特徵的表現，使用了202張超音波影像。結果顯示，GPT-4在大多數類別中具高特異性但低敏感性，對低風險結節的敏感性僅25%，而高風險結節的敏感性為75%。雖然在識別平滑邊緣方面表現較好，但在其他特徵上則不理想。整體來看，這些模型在臨床應用前仍需改進和驗證。 PubMed DOI

原始文章

站上相關主題文章列表