Artificial Intelligence in Postoperative Care: Assessing Large Language Models for Patient Recommendations in Plastic Surgery.
人工智慧在手術後護理中的應用：評估大型語言模型在整形外科患者建議中的效果。 Healthcare (Basel) 2024-06-19

研究比較了三個大型語言模型（LLMs）- ChatGPT-3.5、GPT-4和Gemini-在為整形外科患者提供術後護理建議的表現。結果顯示，這些模型提供的資訊都很準確，其中GPT-3.5在評分上表現最好。Gemini的回應更易讀、更易懂。雖然LLMs在術後護理方面有潛力，但仍需進一步研究和改進，才能成為更完善的資源。 PubMed DOI

Bridging the Gap: Can Large Language Models Match Human Expertise in Writing Neurosurgical Operative Notes?
彌合差距：大型語言模型能否匹配人類專家在撰寫神經外科手術記錄方面的能力？ World Neurosurg 2024-08-17

這項研究探討了人工智慧（AI）在神經外科手術文檔的應用，分析了36份手術記錄，並利用ChatGPT 4.0撰寫記錄。研究團隊評估了144份記錄，結果顯示AI生成的記錄在準確性（4.44）和組織性（4.54）上表現良好，但內容得分較低（3.73）。可讀性方面，AI記錄的複雜度較高，顯示其在提升神經外科文檔效率上有潛力，但仍需改善內容質量。 PubMed DOI

Do ChatGPT and Gemini Provide Appropriate Recommendations for Pediatric Orthopaedic Conditions?
ChatGPT 和 Gemini 是否對小兒骨科疾病提供適當的建議？ J Pediatr Orthop 2024-08-22

這項研究評估了大型語言模型（LLMs），如ChatGPT和Gemini，在提供小兒骨科疾病建議的可靠性，並參考了美國骨科醫學會（AAOS）的指導方針。結果顯示，ChatGPT和Gemini的符合率分別為67%和69%，差異不大。值得注意的是，ChatGPT沒有引用任何研究，而Gemini則參考了16項研究，但大多數存在錯誤或不一致。總體來看，這些模型雖然在某程度上符合指導方針，但仍有許多中立或不正確的陳述，顯示醫療AI模型需改進與提高透明度。 PubMed DOI

Evaluating the Adherence of Large Language Models to Surgical Guidelines: A Comparative Analysis of Chatbot Recommendations and North American Spine Society (NASS) Coverage Criteria.
評估大型語言模型對外科指導方針的遵循性：Chatbot 建議與北美脊柱學會 (NASS) 覆蓋標準的比較分析。 Cureus 2024-10-04

這項研究調查了四個大型語言模型（LLMs）—Bard、BingAI、ChatGPT-3.5 和 ChatGPT-4—在遵循2023年北美脊椎學會（NASS）頸椎融合指導方針的表現。結果顯示，這些模型的遵循率不高，ChatGPT-4和Bing Chat表現較佳，僅達60%。在特定情況下，所有模型都未能符合NASS建議，顯示出明顯差異。研究強調了對LLMs進行更好訓練的需求，並指出在臨床決策中考慮病人特徵的重要性，顯示出人工智慧在醫療中的潛力與挑戰。 PubMed DOI

Evaluating AI-Generated informed consent documents in oral surgery: A comparative study of ChatGPT-4, Bard gemini advanced, and human-written consents.
評估人工智慧生成的口腔外科知情同意文件：ChatGPT-4、Bard gemini advanced 與人類撰寫同意書的比較研究。 J Craniomaxillofac Surg 2024-11-03

這項研究比較了AI平台ChatGPT-4和Bard Gemini Advanced所生成的知情同意文件，與一名一年級口腔外科住院醫師撰寫的文件。經18位專家評估，結果顯示ChatGPT-4在準確性、完整性和可讀性上均優於Bard和人類撰寫的文件。具體來說，ChatGPT-4的得分在各項目中均為4，而Bard為3，人類同意書也為4。研究強調AI在知情同意過程中的潛力，但也指出需持續評估和整合患者反饋，以確保其在臨床上的有效性。 PubMed DOI

Generation of preoperative anaesthetic plans by ChatGPT-4.0: a mixed-method study.
ChatGPT-4.0 生成的術前麻醉計劃：一項混合方法研究。 Br J Anaesth 2024-11-15

最近的研究評估了ChatGPT在術前麻醉計畫中的表現。研究發現，ChatGPT生成的計畫與資深麻醉顧問的計畫存在一致性，但在心肺風險評估上經常出現分歧。其回應重複，偏好全身麻醉，且缺乏局部麻醉技術，氣道管理和術後鎮痛建議也不一致。雖然某些差異不顯著，但對高風險患者的建議被認為不當。總體來看，ChatGPT的麻醉計畫未達臨床標準，未來需進一步評估其在臨床中的應用。 PubMed DOI

Artificial intelligence versus clinical judgement: how accurately do generative models reflect CNS guidelines for chiari malformation?
人工智慧與臨床判斷：生成模型在 Chiari malformation 中對中樞神經系統指導方針的反映準確性如何？ Clin Neurol Neurosurg 2024-11-29

這項研究評估了四個生成式人工智慧模型在回答2023年神經外科醫師大會對Chiari 1畸形指導方針問題的表現。研究提出十三個問題，結果顯示Perplexity的符合率最高，達69.2%，而ChatGPT 4o最低，僅23.1%。Copilot和Gemini的符合率分別為61.5%和30.8%。所有模型的可讀性都很高，顯示出理解上的困難。研究強調，雖然AI能協助臨床，但醫生在解讀AI回應時的判斷仍然至關重要。 PubMed DOI

Can generative artificial intelligence provide accurate medical advice?: a case of ChatGPT versus Congress of Neurological Surgeons management of acute cervical spine and spinal cord injuries clinical guidelines.
生成式人工智慧能提供準確的醫療建議嗎？：ChatGPT 與神經外科醫師大會急性頸椎和脊髓損傷臨床指導方針的比較。 Asian Spine J 2025-03-04

這項研究評估了ChatGPT-4.0在頸椎和脊髓損傷管理上與神經外科醫師學會（CNS）指導方針的一致性。共設計36個問題，分為治療性、診斷性和臨床評估類型。結果顯示，61.1%的回應與指導方針一致，其中治療性問題的符合率為70.8%。不過，對於I級證據的建議，ChatGPT表現不佳，僅有20%的符合率。總體來看，雖然ChatGPT在某些方面表現中等，但醫療人員在使用AI建議時仍需謹慎，待更穩健的模型出現。 PubMed DOI

Using Natural Language Processing to Automate Screening of Abstracts for Neurosurgical Guideline Creation.
使用自然語言處理自動化篩選摘要以建立神經外科指導方針。 Neurosurgery 2025-04-14

隨著神經外科文獻不斷增加，手動篩選系統評價和指導方針的摘要變得越來越困難。為了解決這個問題，我們評估了兩個大型語言模型（LLMs），Gemini Pro 和 ChatGPT-4o-mini，針對美國神經外科醫學會的 Chiari I 畸形指導方針進行自動篩選。測試結果顯示，Gemini Pro 的敏感性高達 95%，特異性 60%，而 ChatGPT-4o-mini 的敏感性僅 18%，但特異性高達 95%。兩者都能在一小時內完成篩選，顯著縮短時間。這些結果顯示 LLM 在神經外科摘要篩選上的潛力，未來可能幫助醫學領域的指導方針實時更新。 PubMed DOI

Large language model-generated clinical practice guideline for appendicitis.
大型語言模型生成的闌尾炎臨床實踐指引 Surg Endosc 2025-04-18

這項研究發現，像ChatGPT-4等大型語言模型在協助制定臨床指引時，能幫忙搜尋資料和草擬建議，但還無法獨立完成系統性文獻搜尋和評估偏誤。雖然LLM產出的指引品質稍低於專家，但整體表現相近，有潛力節省時間和資源，未來還需更多研究和合作才能安全應用於臨床。 PubMed DOI

原始文章

站上相關主題文章列表