The Rapid Development of Artificial Intelligence: GPT-4's Performance on Orthopedic Surgery Board Questions.
人工智慧的快速發展：GPT-4在骨科手術委員會問題上的表現。 Orthopedics 2024-03-21

OpenAI最新的AI模型GPT-4在醫學應用特別是骨科方面有顯著進展。研究顯示，GPT-4在回答骨科問題時比GPT-3.5更準確，接近骨科住院醫師水準，甚至超越普通實習生。這顯示AI模型的進步，未來可能在臨床上有更廣泛的應用。 PubMed DOI

A pilot study on the efficacy of GPT-4 in providing orthopedic treatment recommendations from MRI reports.
GPT-4在提供MRI報告的骨科治療建議方面功效的初步研究。 Sci Rep 2024-03-08

研究發現GPT-4在臨床磁振造影報告中對膝蓋和肩膀骨科疾病治療提供了部分正確且實用的建議，但仍有限制。醫護人員在使用語言模型建議時，應提供批判性指導，因為建議可能不適合獨立患者使用，需要準確的數據輸入。 PubMed DOI

The ability of artificial intelligence tools to formulate orthopaedic clinical decisions in comparison to human clinicians: An analysis of ChatGPT 3.5, ChatGPT 4, and Bard.
人工智慧工具在骨科臨床決策中與人類臨床醫師相比的能力：對ChatGPT 3.5、ChatGPT 4和Bard的分析。 J Orthop 2024-01-25

研究比較三種人工智慧工具在骨科臨床決策上的表現，發現ChatGPT 4與人類回應最一致。然而在爭議案例中，人工智慧工具表現較不準確，顯示仍有改進空間。在臨床應用上需謹慎整合，未來研究應專注於開發專用臨床人工智慧工具以提升效能。 PubMed DOI

The performance of ChatGPT on orthopaedic in-service training exams: A comparative study of the GPT-3.5 turbo and GPT-4 models in orthopaedic education.
ChatGPT 在骨科住院培訓考試中的表現：GPT-3.5 turbo 和 GPT-4 模型在骨科教育中的比較研究。 J Orthop 2024-01-05

研究探討使用GPT-3.5 Turbo和GPT-4等AI模型進行骨科培訓考試。結果顯示，GPT-4在準確性和問題類型上優於GPT-3.5 Turbo，顯示AI在骨科領域有潛力。然而，目前AI無法取代骨科培訓，顯示醫學領域需要專門的AI培訓。 PubMed DOI

Performance of GPT-4 and GPT-3.5 in generating accurate and comprehensive diagnoses across medical subspecialties.
GPT-4和GPT-3.5在各醫學專科中生成準確和全面診斷的表現。 J Chin Med Assoc 2024-03-06

研究比較了最新的人工智慧模型 GPT-4 與前身 GPT-3.5 在81個複雜醫學案例的表現。GPT-4 在主要診斷準確率達38.3%，在不同診斷方面提高至71.6%。它在84.0%的案例提出主要診斷建議，大多數領域優於GPT-3.5，除了藥物反應。GPT-4 在感染性疾病和藥物反應方面表現優異，但在認知障礙案例中稍差。總的來說，GPT-4 在準確診斷、全面不同診斷和適當調查方面展現潛力，雖然表現因醫學專業領域而略有不同。 PubMed DOI

Assessing Generative Pretrained Transformers (GPT) in Clinical Decision-Making: Comparative Analysis of GPT-3.5 and GPT-4.
評估生成式預訓練轉換器(GPT)在臨床決策中的應用：GPT-3.5與GPT-4的比較分析。 J Med Internet Res 2024-06-27

研究比較了ChatGPT-3.5和ChatGPT-4在醫療決策中的表現，結果顯示GPT-4優於GPT-3.5。資深醫師給予較高評分，尤其在倫理問題上。AI有助於醫師，但不應取代人類專業知識，需進一步研究整合到臨床環境中的方法。 PubMed DOI

"Dr. AI Will See You Now": How Do ChatGPT-4 Treatment Recommendations Align With Orthopaedic Clinical Practice Guidelines?
「AI 醫生現在會見您」：ChatGPT-4 的治療建議如何與骨科臨床實踐指導方針對齊？ Clin Orthop Relat Res 2024-09-09

這項研究評估了ChatGPT-4在生成骨科疾病治療建議的有效性，並與美國骨科醫學會的指導方針及醫師計畫進行比較。主要發現包括： 1. ChatGPT-4的建議與AAOS指導方針一致性達90%。 2. 與主治醫師的建議一致性為78%。 3. 在骨折及關節炎案例中表現優異，但腕管綜合症表現不佳。 4. 不一致主要出現在腕管綜合症及其他特定損傷。 5. 雖然ChatGPT-4能提供準確建議，但在考量患者特定因素時仍需醫師的批判性評估。總之，ChatGPT-4在骨科治療中具輔助潛力，但需專業監督。 PubMed DOI

Artificial Intelligence in Physical Therapy: Evaluating ChatGPT's Role in Clinical Decision Support for Musculoskeletal Care.
物理治療中的人工智慧：評估 ChatGPT 在肌肉骨骼護理臨床決策支持中的角色。 Ann Biomed Eng 2025-01-06

人工智慧，特別是ChatGPT，在醫學領域的應用引起了廣泛關注。最近一項研究探討了ChatGPT-4在肌肉骨骼疾病物理治療中的表現，針對脊椎、下肢和上肢問題提出了三十個臨床問題。結果顯示，ChatGPT的回應與臨床實踐指導方針的符合率達80%，上肢疾病的準確率更是高達100%。雖然脊椎疾病的準確率較低，但整體而言，ChatGPT在物理治療決策中展現了輔助工具的潛力，仍需進一步研究以提升其臨床應用。 PubMed DOI

Quantitative evaluation of GPT-4's performance on US and Chinese osteoarthritis treatment guideline interpretation and orthopaedic case consultation.
GPT-4 在美國和中國骨關節炎治療指導解讀及骨科病例諮詢中的表現定量評估。 BMJ Open 2025-01-14

這項研究評估了GPT-4在解讀美國和中國骨關節炎治療指導方針的能力，以及在骨科病例診斷和管理上的有效性。研究結果顯示，GPT-4對指導方針的正確匹配率為46.4%，準確度得分為4.3±1.6，完整性得分為2.8±0.6。在模擬案例中，超過88%的回應被認為是全面的。總體來看，GPT-4在骨科實踐和病人教育上有潛力，但在臨床應用上仍需進一步驗證。 PubMed DOI

Comparitive performance of artificial intelligence-based large language models on the orthopedic in-training examination.
人工智慧大型語言模型在骨科訓練考試中的比較表現。 J Orthop Surg (Hong Kong) 2025-03-03

這項研究評估了三個大型語言模型（LLMs）—OpenAI的GPT-4、GPT-3.5和Google Bard—在2022年骨科住院醫師訓練考試（OITE）中的表現。結果顯示，GPT-4的表現超過及格門檻，與高年級住院醫師相當，明顯優於GPT-3.5和Bard。GPT-3.5和Bard則未達及格，且在影像相關問題上，GPT-3.5表現顯著下降。整體來看，GPT-4在各類問題上展現出強大的能力，超越了考試的最低要求。 PubMed DOI

原始文章

站上相關主題文章列表