How Appropriate Are Recommendations of Online Chat-Based Artificial Intelligence (ChatGPT) to Common Questions on Ventral Hernia Repair?
網路聊天型人工智慧(ChatGPT)對腹壁疝修補常見問題的建議有多適切？ J Laparoendosc Adv Surg Tech A 2024-04-05

這個研究旨在評估ChatGPT對於處理腹壁疝氣相關問題的回應的準確性和適用性，因為有必要驗證AI模型在醫學主題上提供的資訊可靠性。 PubMed DOI

Generative artificial intelligence chatbots may provide appropriate informational responses to common vascular surgery questions by patients.
生成式人工智慧聊天機器人可能會向患者提供關於常見血管外科問題的適當資訊回答。 Vascular 2024-03-19

研究比較了ChatGPT-3.5和Google Bard在回答血管手術相關問題時的表現，發現ChatGPT的回答更準確完整，易讀且適合大專程度；Bard則適合高中程度但品質較低。ChatGPT提供較長回答，顯示在血管手術病人教育上有潛力，但仍需進一步研究改進。 PubMed DOI

ChatGPT and retinal disease: a cross-sectional study on AI comprehension of clinical guidelines.
ChatGPT 與視網膜疾病：一項關於 AI 理解臨床指導方針的橫斷面研究。 Can J Ophthalmol 2024-08-03

這項研究評估了ChatGPT（4.0版）在生成與常見視網膜疾病相關回應的表現，依據美國眼科醫學會的指導方針進行。研究包含130個問題，涵蓋12個領域，專家評估回應的相關性和準確性。結果顯示，ChatGPT的平均得分為4.9分，與指導方針高度一致，但外科管理得分最低。回應可讀性較低，需大學以上理解能力，且在診斷和治療選擇上有錯誤。整體而言，雖然顯示潛力，但仍需臨床醫師監督及改進。 PubMed DOI

Assessing ChatGPT4 with and without retrieval-augmented generation in anticoagulation management for gastrointestinal procedures.
評估 ChatGPT4 在抗凝管理中對於胃腸道程序的檢索增強生成有無影響。 Ann Gastroenterol 2024-09-06

這項研究評估了ChatGPT-4在抗凝治療管理方面的準確性，特別針對接受胃腸道手術的患者，並與ChatGPT-3.5及增強檢索生成模型（ChatGPT4-RAG）比較。結果顯示，ChatGPT-4的完全準確率為30.5%，而ChatGPT4-RAG則達到75%。儘管如此，研究指出75%的準確率仍不足以獨立做臨床決策，AI應視為醫生的輔助工具，並需持續評估以保障病人隱私及醫病關係。 PubMed DOI

Assessing the Performance of ChatGPT in Answering Patients' Questions Regarding Congenital Bicuspid Aortic Valve.
評估 ChatGPT 在回答患者關於先天性雙葉主動脈瓣問題上的表現。 Cureus 2024-11-25

像ChatGPT這樣的AI模型在醫學上雖然帶來不少好處，但也引發了對資訊質量和可靠性的擔憂。一項研究評估了ChatGPT對假設性先天性二尖瓣主動脈瓣病人的回答，發現其提供的資訊雖然詳細，但缺乏針對個別病人的具體建議，且沒有引用來源來驗證真實性。此外，AI也無法替代醫生與病人之間的細緻溝通。隨著AI在醫療中的應用增加，解決這些問題和倫理考量變得相當重要，以確保AI是輔助而非取代醫療提供者的角色。 PubMed DOI

Can ChatGPT 4.0 Diagnose Acute Aortic Dissection? Integrating Artificial Intelligence into Medical Diagnostics.
ChatGPT 4.0 能否診斷急性主動脈剝離？將人工智慧整合進醫學診斷中。 Am J Cardiol 2025-01-18

急性主動脈剝離（AD）是一種危及生命的疾病，常因症狀與其他病症相似而被誤診。本研究探討了OpenAI的AI模型ChatGPT 4.0在診斷急性AD的有效性。透過系統性搜尋PubMed，找到163篇案例報告，隨機分析十篇。患者年齡介於29至82歲，性別分佈均衡，高血壓為常見合併症。結果顯示，ChatGPT 4.0能成功將急性AD列為前三名的鑑別診斷之一，並在五個案例中確定為主要診斷。研究指出，ChatGPT 4.0可作為輔助工具，幫助醫生進行早期篩檢。 PubMed DOI

Evaluating the Evolution of ChatGPT as an Information Resource in Shoulder and Elbow Surgery.
評估 ChatGPT 作為肩膀和肘部外科資訊資源的演變。 Orthopedics 2025-01-29

這項研究評估了ChatGPT（3.5和4版本）在提供肩膀和肘部手術資訊的準確性，分析了114個問題。結果顯示，ChatGPT 3.5的正確率為52.3%，而ChatGPT 4則達到73.3%。雖然3.5在不穩定性類別表現較佳，但4在大多數其他類別中表現更優。兩者的表現都超過50%的熟練度，但仍無法取代臨床決策。研究建議進一步改善ChatGPT的訓練，以提升其作為醫療資訊資源的效用。 PubMed DOI

Evaluating the role of AI chatbots in patient education for abdominal aortic aneurysms: a comparison of ChatGPT and conventional resources.
評估 AI 聊天機器人在腹主動脈瘤患者教育中的角色：ChatGPT 與傳統資源的比較。 ANZ J Surg 2025-03-05

這項研究評估了ChatGPT提供的腹主動脈瘤（AAA）資訊質量，並與澳洲健康指導（HDA）進行比較。研究發現，ChatGPT的回應臨床上適當，但可讀性較高，達到大學水平，而HDA則在10到12年級。雖然ChatGPT的回應通常更易理解，但可行性得分較低，且行動建議不夠明確。總體來看，ChatGPT可作為病人教育的工具，但需改進以提升其幫助病人做出知情決策的能力。 PubMed DOI

A cross-sectional study to evaluate responses generated by two AI software programs for common patient queries about laparoscopic repair of inguinal hernia.
一項橫斷面研究評估兩個 AI 軟體程序對於關於腹腔鏡修補腹股溝疝氣的常見病人詢問所產生的回應。 Updates Surg 2025-03-05

這項研究評估了兩個AI聊天機器人，ChatGPT和ChatSonic，針對腹腔鏡修補腹股溝疝氣的問題所提供的回答質量。研究者提出十個問題，並由兩位外科醫生使用全球質量評分（GQS）和修改版的DISCERN評分來評估。結果顯示，ChatGPT的回答質量較高，獲得了良好的評分，而ChatSonic的表現稍遜。雖然兩者都有潛力，但在可靠性和質量上的不一致性，顯示在臨床使用前仍需進一步驗證。 PubMed DOI

ChatGPT-4 Effectively Responds to Common Patient Questions on Total Ankle Arthroplasty: A Surgeon-Based Assessment of AI in Patient Education.
ChatGPT-4 有效回應關於全踝關節置換術的常見病人問題：基於外科醫生的人工智慧在病人教育中的評估。 Foot Ankle Orthop 2025-03-31

這項研究評估了ChatGPT-4在回答全踝關節置換術（TAA）相關問題的表現。研究人員提出十二個常見問題，並請四位專科外科醫生評分其回答的準確性和清晰度。平均得分為1.8（滿分4分），顯示在事實性問題上表現尚可，但對於術後方案等細緻問題評分較低。外科醫生的評分差異顯著，顯示出不同的解讀和期望。這強調了針對特定臨床情境設計AI工具的必要性，以提升病人教育和資訊的準確性。 PubMed DOI

原始文章

站上相關主題文章列表