Evaluating the Performance of ChatGPT4.0 Versus ChatGPT3.5 on the Hand Surgery Self-Assessment Exam: A Comparative Analysis of Performance on Image-Based Questions.
評估 ChatGPT4.0 與 ChatGPT3.5 在手外科自我評估考試中的表現：基於影像問題的表現比較分析。 Cureus 2025-02-17

本研究比較了ChatGPT4.0與3.5在手外科影像問題上的表現，發現兩者在正確率上無顯著差異（分別為30.1%和28.7%）。雖然ChatGPT4.0提供的解釋較長，但對答案的信心卻較低，尤其在放射影像問題上表現出更高的不確定性。未來研究應探討AI生成的回答如何影響臨床與教育環境中的行為，以促進AI在醫療中的應用。 PubMed DOI

ChatGPT 4.0's efficacy in the self-diagnosis of non-traumatic hand conditions.
ChatGPT 4.0 在非創傷性手部疾病自我診斷中的效能。 J Hand Microsurg 2025-02-26

這項研究探討了ChatGPT 4.0作為手部疾病初步診斷工具的有效性，涵蓋了觸發指、杜普伊特氏攣縮、腕管症候群等疾病。結果顯示，GPT-4.0對大多數疾病的診斷準確率超過95%，但拇指掌腕關節骨關節炎的準確率僅60%。在97%的案例中，GPT-4.0建議患者尋求醫療協助。研究也分析了其使用的術語，發現某些疾病之間有重疊。總體來看，GPT-4.0作為診斷輔助工具有潛力，但仍需進一步研究以提升準確性。 PubMed DOI

Matching Human Expertise: ChatGPT's Performance on Hand Surgery Examinations.
匹配人類專業知識：ChatGPT 在手外科考試中的表現。 Hand (N Y) 2025-03-21

這項研究評估了ChatGPT 4o在美國手外科學會（ASSH）自我評估問題上的表現，並與先前版本比較。研究使用2008至2013年的ASSH考試數據，透過OpenAI的API進行統計分析。結果顯示，ChatGPT 4o在增強技術的幫助下，表現與人類考生相當，明顯超越ChatGPT 3.5，且測試的可靠性很高。這些發現顯示，人工智慧，特別是ChatGPT，能有效支持醫學教育和臨床實踐，達到與人類專家相似的評估水平。 PubMed DOI

Breaking Bones, Breaking Barriers: ChatGPT, DeepSeek, and Gemini in Hand Fracture Management.
打破骨頭，打破障礙：ChatGPT、DeepSeek 和 Gemini 在手部骨折管理中的應用。 J Clin Med 2025-03-27

這項研究評估了三個人工智慧模型—ChatGPT-4o、DeepSeek-V3 和 Gemini 1.5—在手部骨折診斷與治療建議的有效性，並與經驗豐富的外科醫生進行比較。結果顯示，ChatGPT-4o的準確率最高，但精確度較低；DeepSeek-V3表現中等，偶爾漏掉正確方案；而Gemini 1.5則表現不佳。結論指出，雖然AI能增強臨床流程，但在複雜案例中仍無法取代人類專業，且需解決倫理問題才能廣泛應用。 PubMed DOI

Artificial intelligence versus orthopedic surgeons as an orthopedic consultant in the emergency department.
人工智慧與骨科醫生在急診部門作為骨科顧問的比較。 Injury 2025-03-27

這項研究評估了ChatGPT-4在急診室常見骨科情境中的表現，並與四位專科醫生進行比較。研究涵蓋20個問題，涉及診斷、管理及病人諮詢等方面。結果顯示，AI在回應的完整性、幫助性和質量上均優於人類醫生，且準確性無顯著差異。特別是在遠端橈骨骨折和外側踝骨骨折的回應上，AI表現尤為出色。整體而言，AI在急診骨科諮詢中展現出高質量建議的潛力，未來可望增強臨床決策。 PubMed DOI

The Challenges of Using ChatGPT for Clinical Decision Support in Orthopaedic Surgery: A Pilot Study.
使用 ChatGPT 進行骨科手術臨床決策支持的挑戰：一項初步研究。 J Am Acad Orthop Surg 2025-03-28

這項研究探討了人工智慧，特別是ChatGPT-4，在分析複雜臨床數據及生成合理評估和計畫的能力，特別針對骨科手術。研究聚焦於急診部門的十種常見骨折，利用患者的諮詢紀錄來提供AI所需的病史和檢查結果。結果顯示，ChatGPT-4能產出安全且合理的計畫，與多專科會議的臨床結果相符。雖然對大型語言模型的評估仍在發展中，但這項研究顯示AI在臨床決策中的潛力，未來可考慮以實際臨床結果作為基準。 PubMed DOI

Comparison of ChatGPT's Diagnostic and Management Accuracy of Foot and Ankle Bone-Related Pathologies to Orthopaedic Surgeons.
ChatGPT 在足踝骨骼相關病變之診斷與治療準確度與骨科醫師的比較 J Am Acad Orthop Surg 2025-04-15

這項研究發現，ChatGPT-4在診斷和建議治療足踝骨骼損傷時表現不錯，能準確給出標準答案，且不會亂編內容。不過，它在提供更深入或超出標準的醫療建議時還有不足。整體來說，對病患或非專科醫師來說，ChatGPT-4是有潛力的輔助工具，但資訊深度有限。 PubMed DOI

The role of artificial intelligence in predicting injured structures based on clinical images of lacerations in the volar aspect of the hand and forearm.
人工智慧在預測手部與前臂掌側撕裂傷臨床影像中受損結構的角色 J Hand Microsurg 2025-04-28

這項研究發現，傳統理學檢查在辨識手部和前臂受傷的準確度優於AI（ChatGPT-4.0），敏感度和特異度都比較高。不過，AI在診斷手部及前臂屈側損傷時，還是有當作輔助工具的潛力。 PubMed DOI

Leveraging ChatGPT for improved decision-making in interfacility transfers for plastic surgery emergencies based on United States guidelines.
運用 ChatGPT 依據美國指引提升整形外科急症院際轉診決策品質 JPRAS Open 2025-06-09

這項研究發現，ChatGPT-4.0在判斷整形外科急症是否需要轉診時，建議有77%符合專家指引，尤其在手部外傷表現較好，但對燒燙傷和臉部外傷準確度較低。雖然有潛力協助分級轉診，但建議仍需醫師把關，不能完全取代臨床判斷。 PubMed DOI

Dall-E in hand surgery: Exploring the utility of ChatGPT image generation.
Dall-E 在手部外科的應用：探討 ChatGPT 影像生成的實用性 Surg Open Sci 2025-06-09

這項研究發現，ChatGPT-4.5在手外科教育上，提供的資訊比3.5版更正確、好懂又實用；GPT-4o則能產生最精確的醫學影像。雖然AI工具在手外科教育很有潛力，但還需要再改進，才能真正應用在臨床上。 PubMed DOI

原始文章

站上相關主題文章列表