The Rapid Development of Artificial Intelligence: GPT-4's Performance on Orthopedic Surgery Board Questions.
人工智慧的快速發展：GPT-4在骨科手術委員會問題上的表現。 Orthopedics 2024-03-21

OpenAI最新的AI模型GPT-4在醫學應用特別是骨科方面有顯著進展。研究顯示，GPT-4在回答骨科問題時比GPT-3.5更準確，接近骨科住院醫師水準，甚至超越普通實習生。這顯示AI模型的進步，未來可能在臨床上有更廣泛的應用。 PubMed DOI

A pilot study on the efficacy of GPT-4 in providing orthopedic treatment recommendations from MRI reports.
GPT-4在提供MRI報告的骨科治療建議方面功效的初步研究。 Sci Rep 2024-03-08

研究發現GPT-4在臨床磁振造影報告中對膝蓋和肩膀骨科疾病治療提供了部分正確且實用的建議，但仍有限制。醫護人員在使用語言模型建議時，應提供批判性指導，因為建議可能不適合獨立患者使用，需要準確的數據輸入。 PubMed DOI

The performance of ChatGPT on orthopaedic in-service training exams: A comparative study of the GPT-3.5 turbo and GPT-4 models in orthopaedic education.
ChatGPT 在骨科住院培訓考試中的表現：GPT-3.5 turbo 和 GPT-4 模型在骨科教育中的比較研究。 J Orthop 2024-01-05

研究探討使用GPT-3.5 Turbo和GPT-4等AI模型進行骨科培訓考試。結果顯示，GPT-4在準確性和問題類型上優於GPT-3.5 Turbo，顯示AI在骨科領域有潛力。然而，目前AI無法取代骨科培訓，顯示醫學領域需要專門的AI培訓。 PubMed DOI

The Large Language Model ChatGPT-4 Demonstrates Excellent Triage Capabilities and Diagnostic Performance for Patients Presenting with Various Causes of Knee Pain.
ChatGPT-4 大型語言模型展現出對於因不同原因導致膝蓋疼痛的患者具有優秀的分流能力和診斷表現。 Arthroscopy 2024-06-26

研究測試了ChatGPT-4在處理膝疼痛投訴、提供不同診斷和治療方案的表現。ChatGPT-4的診斷通常準確，與專業醫師看法一致。當提供更多資訊時，ChatGPT-4的準確性提高，有時甚至達到100%。它提供了合理的診斷和治療建議，但也可能有錯誤，需要進一步臨床評估。 PubMed DOI

Artificial Intelligence-Powered Hand Surgery Consultation: GPT-4 as an Assistant in a Hand Surgery Outpatient Clinic.
人工智慧驅動的手外科諮詢：GPT-4作為手外科門診的助手。 J Hand Surg Am 2024-07-27

這項研究探討了GPT-4作為手外科門診的諮詢助手，模擬了10種常見手部疾病的病人情境。GPT-4進行病史訪談，並利用提示工程技術協助診斷。專業手外科醫生用李克特量表評估其表現，平均得分為4.6，顯示在病史記錄上表現不錯。研究建議GPT-4可能成為病人照護的有用工具，但仍需進一步研究以確認其在真實臨床環境中的有效性。 PubMed DOI

Performance of ChatGPT on Solving Orthopedic Board-Style Questions: A Comparative Analysis of ChatGPT 3.5 and ChatGPT 4.
ChatGPT 在解決骨科考試風格問題上的表現：ChatGPT 3.5 與 ChatGPT 4 的比較分析。 Clin Orthop Surg 2024-08-02

這項研究評估了ChatGPT 3.5和4在回答骨科考試問題的表現，使用了來自首爾國立大學醫院的160道問題，分為11個子類別。結果顯示，ChatGPT 3.5的正確率為37.5%，而ChatGPT 4提升至60.0%（p < 0.001）。大部分類別中，ChatGPT 4表現較佳，唯獨在腫瘤相關問題上不如3.5。此外，ChatGPT 4的回答不一致率顯著低於3.5（9.4%對比47.5%）。雖然ChatGPT 4在骨科考試中表現不錯，但仍需謹慎對待其不一致的回答和錯誤解釋。 PubMed DOI

"Dr. AI Will See You Now": How Do ChatGPT-4 Treatment Recommendations Align With Orthopaedic Clinical Practice Guidelines?
「AI 醫生現在會見您」：ChatGPT-4 的治療建議如何與骨科臨床實踐指導方針對齊？ Clin Orthop Relat Res 2024-09-09

這項研究評估了ChatGPT-4在生成骨科疾病治療建議的有效性，並與美國骨科醫學會的指導方針及醫師計畫進行比較。主要發現包括： 1. ChatGPT-4的建議與AAOS指導方針一致性達90%。 2. 與主治醫師的建議一致性為78%。 3. 在骨折及關節炎案例中表現優異，但腕管綜合症表現不佳。 4. 不一致主要出現在腕管綜合症及其他特定損傷。 5. 雖然ChatGPT-4能提供準確建議，但在考量患者特定因素時仍需醫師的批判性評估。總之，ChatGPT-4在骨科治療中具輔助潛力，但需專業監督。 PubMed DOI

Exploring the Performance of ChatGPT in an Orthopaedic Setting and Its Potential Use as an Educational Tool.
探索 ChatGPT 在骨科環境中的表現及其作為教育工具的潛在用途。 JB JS Open Access 2024-11-27

這項研究評估了ChatGPT-4視覺版（GPT-4V）在解讀醫學影像及處理骨科創傷案例的表現。研究分析了十個來自OrthoBullets的熱門案例，並由四位專科醫生對AI的回應進行評分。結果顯示，GPT-4V在影像回應的平均得分為3.46，準確性和可信度較低，分別為3.28和3.15；而在管理問題上得分較高（3.76），治療問題表現最佳（4.04）。結論指出，GPT-4V作為教育工具有潛力，但影像解讀能力仍不及經驗豐富的醫生。 PubMed DOI

Large language models' performances regarding common patient questions about osteoarthritis: A comparative analysis of ChatGPT-3.5, ChatGPT-4.0, and Perplexity.
大型語言模型在關於骨關節炎的常見病人問題上的表現：ChatGPT-3.5、ChatGPT-4.0 和 Perplexity 的比較分析。 J Sport Health Sci 2024-11-29

這項研究評估了三個大型語言模型（LLMs）—ChatGPT-3.5、ChatGPT-4.0 和 Perplexity—在回答骨關節炎（OA）相關問題的準確性。研究將25個問題分為六個主題，並由三位骨科專家進行評分。結果顯示，ChatGPT-4.0的表現最佳，64%的回答被評為「優秀」，而ChatGPT-3.5和Perplexity分別為40%和28%。雖然所有模型的整體評分都很高，但在「治療與預防」方面表現較弱。這項研究顯示了大型語言模型的潛力，特別是ChatGPT-4.0在提供OA資訊上的準確性。 PubMed DOI

Assessing GPT-4's accuracy in answering clinical pharmacological questions on pain therapy.
評估 GPT-4 在疼痛治療臨床藥理學問題回答中的準確性。 Br J Clin Pharmacol 2025-03-11

這項研究評估了GPT-4在回答疼痛管理相關的臨床藥理學問題上的表現。醫療專業人員提出了有關藥物相互作用、劑量和禁忌症的問題，GPT-4的回應在清晰度、詳細程度和醫學準確性上獲得了高評價。結果顯示，99%的參與者認為回應易懂，84%認為信息詳細，93%表示滿意，96%認為醫學準確。不過，只有63%認為信息完整，顯示在藥物動力學和相互作用方面仍有不足。研究建議開發專門的AI工具，結合即時藥理數據庫，以提升臨床決策的準確性。 PubMed DOI

原始文章

站上相關主題文章列表