ChatGPT's Performance in Spinal Metastasis Cases-Can We Discuss Our Complex Cases with ChatGPT?
ChatGPT 在脊椎轉移癌病例中的表現 - 我們能否與 ChatGPT 討論我們的複雜病例？ J Clin Med 2025-01-08

人工智慧（AI）如ChatGPT-4正在改變醫療保健，特別是在脊椎轉移的治療決策上。本研究評估了ChatGPT-4在五個脊椎轉移案例中的表現，並與五位經驗豐富的脊椎外科醫生進行比較。結果顯示，ChatGPT的建議在73%的案例中與醫生一致，但多數建議偏向一般性，缺乏具體臨床指導。這顯示出AI在複雜醫療決策中的潛力與限制，未來需進一步研究以提升其應用效果。 PubMed DOI

ChatGPT is an Unreliable Source of Peer-Reviewed Information for Common Total Knee and Hip Arthroplasty Patient Questions.
ChatGPT 對於常見全膝及全髖關節置換手術病患問題的同行評審資訊是不可靠的來源。 Adv Orthop 2025-01-16

隨著人工智慧和機器學習的進步，像ChatGPT這樣的工具對現代醫學和病人教育產生影響。本研究評估了ChatGPT對全膝關節置換術（TKA）和全髖關節置換術（THA）術前問題的回答有效性。結果顯示，ChatGPT引用的109個來源中，只有36%是準確的，且大多數來源的出版時間集中在2011至2015年。雖然其準確性評分為4.4/6，但引用不準確文獻的比例高達64.22%。因此，使用ChatGPT進行醫學查詢時需謹慎。 PubMed DOI

Evaluating the Quality and Readability of Information Provided by Generative Artificial Intelligence Chatbots on Clavicle Fracture Treatment Options.
評估生成式人工智慧聊天機器人提供的鎖骨骨折治療選項資訊的質量和可讀性。 Cureus 2025-02-10

本研究評估六款生成式AI聊天機器人在鎖骨骨折管理教育中的效果，包括ChatGPT 4、Gemini 1.0等。雖然可讀性分數無顯著差異，但Microsoft Copilot和Perplexity的回答質量明顯優於其他模型。整體來看，這些AI模型在病患教育中表現良好，特別是Microsoft Copilot和Perplexity，適合用於提供鎖骨骨折相關資訊。 PubMed DOI

Can generative artificial intelligence provide accurate medical advice?: a case of ChatGPT versus Congress of Neurological Surgeons management of acute cervical spine and spinal cord injuries clinical guidelines.
生成式人工智慧能提供準確的醫療建議嗎？：ChatGPT 與神經外科醫師大會急性頸椎和脊髓損傷臨床指導方針的比較。 Asian Spine J 2025-03-04

這項研究評估了ChatGPT-4.0在頸椎和脊髓損傷管理上與神經外科醫師學會（CNS）指導方針的一致性。共設計36個問題，分為治療性、診斷性和臨床評估類型。結果顯示，61.1%的回應與指導方針一致，其中治療性問題的符合率為70.8%。不過，對於I級證據的建議，ChatGPT表現不佳，僅有20%的符合率。總體來看，雖然ChatGPT在某些方面表現中等，但醫療人員在使用AI建議時仍需謹慎，待更穩健的模型出現。 PubMed DOI

A cross-sectional study to evaluate responses generated by two AI software programs for common patient queries about laparoscopic repair of inguinal hernia.
一項橫斷面研究評估兩個 AI 軟體程序對於關於腹腔鏡修補腹股溝疝氣的常見病人詢問所產生的回應。 Updates Surg 2025-03-05

這項研究評估了兩個AI聊天機器人，ChatGPT和ChatSonic，針對腹腔鏡修補腹股溝疝氣的問題所提供的回答質量。研究者提出十個問題，並由兩位外科醫生使用全球質量評分（GQS）和修改版的DISCERN評分來評估。結果顯示，ChatGPT的回答質量較高，獲得了良好的評分，而ChatSonic的表現稍遜。雖然兩者都有潛力，但在可靠性和質量上的不一致性，顯示在臨床使用前仍需進一步驗證。 PubMed DOI

Reliability, Accuracy, and Comprehensibility of AI-Based Responses to Common Patient Questions Regarding Spinal Cord Stimulation.
基於人工智慧的回應對於脊髓刺激常見病人問題的可靠性、準確性及可理解性。 J Clin Med 2025-03-17

脊髓刺激（SCS）是一種有效的慢性疼痛治療方法，但患者常有疑問。本研究探討ChatGPT對SCS常見問題的回答在可靠性、準確性和可理解性方面的表現。研究選擇了十三個問題，並由專業醫師和非醫療人士評估。結果顯示，ChatGPT的回答在可靠性和可理解性上表現良好，準確性也達到95%。總結來說，ChatGPT可作為患者教育SCS的輔助工具，尤其在一般性問題上，但對於技術性問題則可能較為困難。 PubMed DOI

Evaluation of the reliability, usefulness, quality and readability of ChatGPT's responses on Scoliosis.
對於脊柱側彎的 ChatGPT 回應的可靠性、有用性、質量和可讀性的評估。 Eur J Orthop Surg Traumatol 2025-03-18

這項研究評估了ChatGPT對脊柱側彎問題的回答在可靠性、有用性、品質和可讀性方面的表現。選擇了十六個常見問題，由兩位專家評分。結果顯示，可靠性平均得分4.68，有用性得分4.84，整體品質得分4.28，評價普遍正面。雖然一般資訊的回答表現不錯，但針對治療和個人化問題的回答仍需加強。可讀性方面，回答需具備高中三年級到大學程度的閱讀能力。總體來說，ChatGPT提供的脊柱側彎資訊可靠，但在特定問題上仍需謹慎使用。 PubMed DOI

AI versus the spinal surgeons in the management of controversial spinal surgery scenarios.
AI 與脊椎外科醫生在爭議性脊椎手術情境中的管理。 Eur Spine J 2025-04-02

這項研究比較了AI模型（ChatGPT-3.5、ChatGPT-4和Google Bard）與經驗豐富的脊椎外科醫生在複雜脊椎手術情境中的表現。透過對十位外科醫生進行兩次問卷調查，結果顯示醫生之間的重測信度良好，但與AI模型的協議較低。雖然AI的回應詳細，但醫生的答案更簡潔。研究認為AI目前不適合用於複雜手術決策，但可用於初步資訊收集和緊急分診，並強調需解決法律和倫理問題才能進一步應用。 PubMed DOI

Artificial intelligence-generated responses to frequently asked questions on coccydynia: Evaluating the accuracy and consistency of GPT-4o's performance.
人工智慧生成對尾骨痛常見問題的回答：評估GPT-4o表現的準確性與一致性 Arch Rheumatol 2025-04-23

這項研究發現，GPT-4o在回答尾骨痛常見問題時，內容大多正確且有一定完整性，但有時回答不夠一致或詳細。雖然可作為病人衛教的參考，但仍不能取代專業醫師的臨床建議。 PubMed DOI

An Assessment of the Accuracy and Consistency of ChatGPT in the Management of Midshaft Clavicle Fractures.
ChatGPT 在處理鎖骨中段骨折管理時的準確性與一致性評估 Cureus 2025-05-09

這項研究發現，ChatGPT-4o在回答鎖骨中段骨折問題時，常混合正確與錯誤資訊，且多數引用的文獻都是假的或錯誤的。整體來說，ChatGPT在這方面的準確性和可靠性有限，建議臨床應用前要特別小心評估風險。 PubMed DOI

原始文章

站上相關主題文章列表