Can artificial intelligence replace biochemists? A study comparing interpretation of thyroid function test results by ChatGPT and Google Bard to practising biochemists.
人工智慧能取代生物化學家嗎？一項比較 ChatGPT 和 Google Bard 對甲狀腺功能測試結果解讀能力與實踐生物化學家的研究。 Ann Clin Biochem 2024-03-15

研究發現ChatGPT和Google Bard在解釋甲狀腺功能檢驗結果方面表現不佳，並無法提供準確或安全的建議。雖然能辨識部分疾病，但整體表現仍有困難。結論指出，這些人工智慧工具尚未能取代專業醫護人員的諮詢。 PubMed DOI

ChatGPT-assisted deep learning model for thyroid nodule analysis: beyond artifical intelligence.
ChatGPT輔助的深度學習模型用於甲狀腺結節分析：超越人工智慧。 Med Ultrason 2024-01-06

透過ChatGPT的協助，我們成功開發了一個深度學習模型，用來分析甲狀腺結節的超音波影像和細針穿刺活檢（FNAB）結果。研究共有1,061位參與者，模型在測試中達到0.81的準確度，對良性和惡性甲狀腺病理的區分表現出高精確度和召回率，平衡的F1分數為0.86。這研究顯示了人工智慧，包括ChatGPT，在醫學影像分析深度學習模型上的潛力。 PubMed DOI

Assessing the role of GPT-4 in thyroid ultrasound diagnosis and treatment recommendations: enhancing interpretability with a chain of thought approach.
評估 GPT-4 在甲狀腺超聲診斷和治療建議中的角色：以思維鏈方法增強可解釋性。 Quant Imaging Med Surg 2024-02-29

研究指出GPT-4在分析甲狀腺癌超音波報告方面表現優異，但在準確診斷上有限制。透過"Chain of Thought"方法增加可解釋性，強調人工智慧表現差異。GPT-4或許可成為醫療工具，特別是生成診斷報告。提出"ThyroAIGuide"線上平台展現人工智慧潛力，但需進一步研究和醫療專業監控，確保患者安全和護理品質。 PubMed DOI

Assessment of ChatGPT's adherence to ETA-thyroid nodule management guideline over two different time intervals 14 days apart: in binary and multiple-choice queries.
ChatGPT對於ETA甲狀腺結節管理指引的遵循評估：在兩個相隔14天的不同時間間隔內，以二元和多選查詢方式。 Endocrine 2024-03-15

研究評估了ChatGPT-v4在甲狀腺結節管理指南上的效果。結果顯示，它在糾正錯誤回答方面有潛力，但也有一些不一致性。在多重選擇問題上表現較為穩定。總的來說，ChatGPT可能成為甲狀腺結節管理的臨床輔助工具，但在不同類型問題上表現有差異。 PubMed DOI

Assessing the role of advanced artificial intelligence as a tool in multidisciplinary tumor board decision-making for primary head and neck cancer cases.
評估先進人工智慧在多學科腫瘤討論會決策中作為主要頭頸癌病例工具的角色。 Front Oncol 2024-06-10

研究發現，在協助頭頸部癌症患者的腫瘤委員會決策中使用AI模型ChatGPT 3.5和ChatGPT 4.0，能提供資訊和臨床建議，但有時會提出多治療選項，甚至建議不符合指引的治療方式。結論指出，AI目前僅能當輔助工具，因為準確性和資訊來源有限。 PubMed DOI

A Comparison of ChatGPT and Multidisciplinary Team Meeting Treatment Recommendations in 10 Consecutive Cervical Cancer Patients.
對於10位連續子宮頸癌患者，ChatGPT與多學科團隊會議治療建議的比較。 Cureus 2024-09-23

這項研究探討了人工智慧（AI）在子宮頸癌多學科團隊（MDT）會議中的預篩選工具角色。研究發現AI建議在治療決策前應諮詢專業醫療人員，且在標準病例中與MDT建議相當一致。AI也提供了有關風險因素的見解，如肥胖，但有時缺乏堅實的醫學證據，甚至包含虛構資訊。因此，雖然AI在某些方面顯示潛力，但仍未能成為MDT中可靠的預篩選工具。 PubMed DOI

Utility of Artificial Intelligence for Decision Making in Thoracic Multidisciplinary Tumor Boards.
人工智慧在胸部多學科腫瘤委員會決策中的應用價值。 J Clin Med 2025-01-25

本研究評估了人工智慧（AI），特別是OpenAI的自然語言處理技術，對胸腔多學科腫瘤委員會（MTB）決策的幫助。研究納入2023年1月至6月診斷為非小細胞肺癌的52位病患，AI模型生成的建議與MTB決策的一致性達76%，Kappa指數為0.59，手術建議的一致性更高，重複案例後達92.3%。結果顯示，AI可成為多學科腫瘤委員會決策的有力支持工具。 PubMed DOI

Appropriateness of Thyroid Nodule Cancer Risk Assessment and Management Recommendations Provided by Large Language Models.
大型語言模型提供的甲狀腺結節癌風險評估與管理建議的適當性。 J Imaging Inform Med 2025-03-03

這項研究評估了大型語言模型（LLMs）如ChatGPT、Gemini和Claude在甲狀腺結節癌症風險評估中的有效性，並與美國甲狀腺協會（ATA）及全國綜合癌症網絡（NCCN）的指導方針進行比較。322名放射科醫生參與評估，結果顯示Claude得分最高，其次是ChatGPT和Gemini。雖然不當回應比率相似，但ChatGPT在準確性上表現最佳。質性反饋指出，ChatGPT清晰且結構良好，Gemini則可及性高但內容淺薄，Claude組織性佳但偶爾偏離主題。總體而言，這些模型在輔助風險評估上有潛力，但仍需臨床監督以確保可靠性。 PubMed DOI

Comparing ChatGPT 4.0's Performance in Interpreting Thyroid Nodule Ultrasound Reports Using ACR-TI-RADS 2017: Analysis Across Different Levels of Ultrasound User Experience.
比較 ChatGPT 4.0 在解讀使用 ACR-TI-RADS 2017 的甲狀腺結節超音波報告中的表現：不同超音波使用者經驗水平的分析。 Diagnostics (Basel) 2025-03-13

本研究評估了ChatGPT 4.0根據ACR-TI-RADS 2017標準解讀甲狀腺超音波報告的能力，並與醫療專家及一名缺乏經驗的使用者進行比較。結果顯示，ChatGPT在回聲焦點的評估上與專家一致，但在其他標準上則有不一致。缺乏經驗的使用者表現優於ChatGPT，顯示傳統醫學訓練的重要性。結論指出，ChatGPT可作為輔助診斷工具，但無法取代人類專業知識，並建議改善AI算法以增強其臨床實用性。 PubMed DOI

ChatGPT-4's Accuracy in Estimating Thyroid Nodule Features and Cancer Risk from Ultrasound Images.
ChatGPT-4 在從超聲影像估計甲狀腺結節特徵和癌症風險方面的準確性。 Endocr Pract 2025-03-26

這項研究評估了GPT-4和GPT-4o在根據TI-RADS指引識別甲狀腺結節特徵的表現，使用了202張超音波影像。結果顯示，GPT-4在大多數類別中具高特異性但低敏感性，對低風險結節的敏感性僅25%，而高風險結節的敏感性為75%。雖然在識別平滑邊緣方面表現較好，但在其他特徵上則不理想。整體來看，這些模型在臨床應用前仍需改進和驗證。 PubMed DOI

原始文章

站上相關主題文章列表