原始文章

本研究探討生成預訓練變壓器(ChatGPT)在放射影像中分類股骨轉子周圍骨折的準確性。研究結果顯示,ChatGPT能根據修訂的AO/OTA分類系統將骨折分為穩定(A1)和不穩定(A2),其分類一致性(κ = 0.420)與骨科醫生相似,顯示中等可靠性。這表明ChatGPT可有效整合進臨床工作流程,並在數據收集上需求較低,對醫療應用具潛力。 PubMed DOI


站上相關主題文章列表

研究指出,在骨科手術中使用AI工具ChatGPT時,雖然能提供相關回答,但有時也會給出不適當的答案。這顯示了在臨床實務中應用ChatGPT的潛力與限制,強調了在醫療領域使用AI工具需謹慎驗證與整合。未來需進一步研究並加強臨床醫師培訓,以確保像ChatGPT這樣的AI工具在臨床決策中的安全可靠性。 PubMed DOI

研究使用AI技術,如ChatGPT和few-shot learning,來協助診斷良性和惡性骨腫瘤。分析1366份影像報告後發現,ChatGPT經過few-shot learning後,準確率從0.73提升至0.87,顯示潛力。研究也討論放射科醫師的報告風格對模型表現的影響,並辨識出誤診案例。強調AI需與醫師合作,才能真正應用。這研究奠定未來醫學診斷AI進步基礎,凸顯few-shot learning在專業領域的優勢。 PubMed DOI

研究發現ChatGPT 4.0在回答骨科手術問題時表現良好,尤其在無需圖像的情況下更為準確。儘管人工智慧在骨科領域有潛力,仍需提升準確性。未來研究應致力於有效運用人工智慧來輔助而非取代醫生的技能。 PubMed DOI

急性髖部骨折對公共健康,特別是老年人,造成重大挑戰。本研究評估ChatGPT-4.0在提供骨折治療建議的準確性,並與美國骨科醫學會(AAOS)的標準進行比較。結果顯示,ChatGPT-4.0的評分與AAOS有正相關,但在長髖髓釘的評估上存在顯著差異,且高估了全髖關節置換等治療的適當性。總體而言,ChatGPT-4.0在急性髖部骨折治療建議上不完全可靠,需進一步改進以符合醫療指導方針,提升病人治療效果。 PubMed DOI

這項研究評估了ChatGPT 4.0在2019年骨科住院醫師訓練考試中的表現。結果顯示,ChatGPT在純文字問題的正確率為49%,而帶有圖片的問題為48%。當圖片描述由AI生成時,表現下降6%。整體來看,ChatGPT的表現低於所有住院醫師班級,尤其比一年級住院醫師低4%。研究指出,雖然ChatGPT在醫學考試中有一定能力,但仍未達到住院醫師的水準,顯示AI在醫學教育中的潛力與限制。 PubMed DOI

這項研究評估了ChatGPT-4視覺版(GPT-4V)在解讀醫學影像及處理骨科創傷案例的表現。研究分析了十個來自OrthoBullets的熱門案例,並由四位專科醫生對AI的回應進行評分。結果顯示,GPT-4V在影像回應的平均得分為3.46,準確性和可信度較低,分別為3.28和3.15;而在管理問題上得分較高(3.76),治療問題表現最佳(4.04)。結論指出,GPT-4V作為教育工具有潛力,但影像解讀能力仍不及經驗豐富的醫生。 PubMed DOI

這項研究評估了ChatGPT在膝關節X光片識別脛骨平台骨折的準確性,分析了111張X光片,其中29例經CT確認為骨折。結果顯示,急診醫師和放射科醫師的表現明顯優於ChatGPT-4,尤其在敏感度上。雖然ChatGPT-4o在特異度上表現接近醫師,但整體診斷能力仍不及人類專家。總之,ChatGPT-4o顯示出潛力,但尚未達到醫師的診斷水準。 PubMed DOI

本研究探討ChatGPT-4o在分析膝關節骨關節炎(OA)X光片的能力,並評估其準確性。117張X光片由兩位骨科醫生和ChatGPT-4o分析,使用多種分級系統。結果顯示,ChatGPT-4o的識別率達100%,但詳細分級準確性僅35%,遠低於醫生的89.6%。此外,ChatGPT-4o在嚴重病例中常低估OA程度,且其評分一致性較差。雖然能快速識別,但在臨床應用上仍需提升分級準確性。未來研究應聚焦於改善這方面的表現。 PubMed DOI

這項研究評估了三個人工智慧模型—ChatGPT-4o、DeepSeek-V3 和 Gemini 1.5—在手部骨折診斷與治療建議的有效性,並與經驗豐富的外科醫生進行比較。結果顯示,ChatGPT-4o的準確率最高,但精確度較低;DeepSeek-V3表現中等,偶爾漏掉正確方案;而Gemini 1.5則表現不佳。結論指出,雖然AI能增強臨床流程,但在複雜案例中仍無法取代人類專業,且需解決倫理問題才能廣泛應用。 PubMed DOI

這項研究探討了人工智慧,特別是ChatGPT-4,在分析複雜臨床數據及生成合理評估和計畫的能力,特別針對骨科手術。研究聚焦於急診部門的十種常見骨折,利用患者的諮詢紀錄來提供AI所需的病史和檢查結果。結果顯示,ChatGPT-4能產出安全且合理的計畫,與多專科會議的臨床結果相符。雖然對大型語言模型的評估仍在發展中,但這項研究顯示AI在臨床決策中的潛力,未來可考慮以實際臨床結果作為基準。 PubMed DOI