Large language models: Are artificial intelligence-based chatbots a reliable source of patient information for spinal surgery?
大型語言模型：基於人工智慧的聊天機器人在脊椎手術方面是可靠的病人資訊來源嗎？ Eur Spine J 2023-10-11

大型語言模型（LLM）是強大的人工智慧工具，可促進類似人類的溝通並提供有價值的資訊。研究發現，ChatGPT在回答脊椎外科醫師有關急性腰椎間盤突出（LDH）問題時表現良好，清晰度高且特定。儘管未涵蓋所有知情同意書內容，但提供額外見解。然而，回答中有些許不準確。LLM如ChatGPT有助於患者教育，但需謹慎監控風險與機會。 PubMed DOI

Evaluating capabilities of large language models: Performance of GPT-4 on surgical knowledge assessments.
評估大型語言模型的能力：GPT-4 在外科知識評估中的表現。 Surgery 2024-03-20

人工智慧如ChatGPT在醫療方面有潛力，尤其在診斷和治療上。研究顯示，在外科知識問題上，ChatGPT的表現接近或超越人類水準，尤其在多重選擇問題上更優秀，提供獨到見解。然而，有時答案可能不正確，且回應可能不一致。儘管表現令人驚豔，但仍需進一步研究以確保在臨床上的安全使用。 PubMed DOI

How Appropriate Are Recommendations of Online Chat-Based Artificial Intelligence (ChatGPT) to Common Questions on Ventral Hernia Repair?
網路聊天型人工智慧(ChatGPT)對腹壁疝修補常見問題的建議有多適切？ J Laparoendosc Adv Surg Tech A 2024-04-05

這個研究旨在評估ChatGPT對於處理腹壁疝氣相關問題的回應的準確性和適用性，因為有必要驗證AI模型在醫學主題上提供的資訊可靠性。 PubMed DOI

The performance of artificial intelligence large language model-linked chatbots in surgical decision-making for gastroesophageal reflux disease.
人工智慧大型語言模型連接的聊天機器人在胃食道逆流病的外科決策中的表現。 Surg Endosc 2024-04-17

研究比較了不同聊天機器人連接大型語言模型後，根據SAGES指南提供GERD手術管理建議的表現。ChatGPT-4、Copilot、Google Bard和Perplexity AI在給予GERD患者建議時的正確性有所不同。結果顯示，這些聊天機器人在遵循SAGES指南方面的表現有差異，顯示了透過LLM連接的聊天機器人在提供臨床建議上的潛力和限制。建議對LLMs進行進一步訓練，特別是在提供基於證據的健康資訊方面。 PubMed DOI

Harnessing artificial intelligence in bariatric surgery: comparative analysis of ChatGPT-4, Bing, and Bard in generating clinician-level bariatric surgery recommendations.
運用人工智慧於肥胖外科手術：比較 ChatGPT-4、Bing 和 Bard 在生成臨床醫師級別的肥胖外科手術建議的分析。 Surg Obes Relat Dis 2024-04-21

研究評估人工智慧回答肥胖手術問題的品質和易讀性，使用不同LLMs提供答案，由肥胖手術醫生評估。結果顯示像ChatGPT-4這樣的模型能提供適當回答，但表現有差異。臨床使用AI需謹慎，提供監督很重要。未來需進一步研究LLMs如何改善肥胖手術醫療服務和決策。 PubMed DOI

Are large language models valid tools for patient information on lumbar disc herniation? The spine surgeons' perspective.
大型語言模型對腰椎間盤突出症患者資訊的有效性：脊椎外科醫師的觀點。 Brain Spine 2024-05-06

生成式人工智慧如ChatGPT和Google Bard被應用在患者教育，例如腰椎間盤突出。研究發現，這些AI回答腰椎間盤突出的問題時，準確性和清晰度有差異，需要改進。未來應該專注於提升AI模型，以增進患者和醫師之間的溝通。 PubMed DOI

Does the Information Quality of ChatGPT Meet the Requirements of Orthopedics and Trauma Surgery?
ChatGPT的資訊品質是否符合骨科和創傷外科的需求？ Cureus 2024-06-17

研究發現，ChatGPT提供的醫學資訊品質不佳，甚至可能有危險。資訊品質高與醫師評分正相關。醫學人工智慧有潛力，但需改進準確性和可靠性。持續研究發展對提升醫療人工智慧應用、改善患者教育和知情同意流程至關重要。 PubMed DOI

Assessing the Efficacy of an AI-Powered Chatbot (ChatGPT) in Providing Information on Orthopedic Surgeries: A Comparative Study With Expert Opinion.
評估 AI 驅動的聊天機器人 (ChatGPT) 在提供骨科手術資訊方面的效能：與專家意見的比較研究。 Cureus 2024-07-29

這項研究探討了開放存取的人工智慧軟體ChatGPT在回答與骨科手術相關的病人問題的準確性。研究聚焦於六種手術，包括前交叉韌帶重建和全髖關節置換等。研究者向ChatGPT提出標準問題，並將其回答與專家意見比較，結果顯示平均得分為2.43，顯示與專家意見有一定一致性。研究指出，ChatGPT可能成為病人了解手術選擇的有用工具，但仍需進一步研究以驗證結果並探討其在外科實踐中的應用。 PubMed DOI

Clinical artificial intelligence: teaching a large language model to generate recommendations that align with guidelines for the surgical management of GERD.
臨床人工智慧：教導大型語言模型生成符合GERD手術管理指導方針的建議。 Surg Endosc 2024-08-12

這項研究比較了通用的 ChatGPT-4 模型與客製化的手術胃食道逆流病工具 (GTS) 在提供胃食道逆流病手術建議的表現。結果顯示，GTS 在外科醫生和病人的詢問中準確率達到 100%，而通用模型對外科醫生的準確率僅為 66.7%，對病人則為 47.5%。GTS 的建議基於證據，符合 2021 年的指導方針，顯示客製化大型語言模型在臨床指導中的潛力。未來需進一步研究其在實際臨床環境中的有效性。 PubMed DOI

A Comparison of ChatGPT and Expert Consensus Statements on Surgical Site Infection Prevention in High-Risk Paediatric Spine Surgery.
高風險兒童脊椎手術中 ChatGPT 與專家共識聲明在手術部位感染預防方面的比較。 J Pediatr Orthop 2024-08-30

這項研究探討了AI語言模型ChatGPT在診斷和管理前肩不穩定性，以及預防小兒脊椎手術感染方面，與骨科醫生的可靠性比較。結果顯示，ChatGPT在14個陳述上與專家意見有合理相關性，但同意程度較低。特別是在紫外線使用的陳述上，ChatGPT的回應與專家不一致，可能因為新文獻影響。總體來看，ChatGPT在簡單問題上準確性尚可，但面對複雜問題時限制明顯。這項研究強調了評估AI在臨床環境中可靠性的重要性。 PubMed DOI

原始文章

站上相關主題文章列表