原始文章

本研究探討ChatGPT-4o在分析膝關節骨關節炎(OA)X光片的能力,並評估其準確性。117張X光片由兩位骨科醫生和ChatGPT-4o分析,使用多種分級系統。結果顯示,ChatGPT-4o的識別率達100%,但詳細分級準確性僅35%,遠低於醫生的89.6%。此外,ChatGPT-4o在嚴重病例中常低估OA程度,且其評分一致性較差。雖然能快速識別,但在臨床應用上仍需提升分級準確性。未來研究應聚焦於改善這方面的表現。 PubMed DOI


站上相關主題文章列表

研究測試了ChatGPT-4在處理膝疼痛投訴、提供不同診斷和治療方案的表現。ChatGPT-4的診斷通常準確,與專業醫師看法一致。當提供更多資訊時,ChatGPT-4的準確性提高,有時甚至達到100%。它提供了合理的診斷和治療建議,但也可能有錯誤,需要進一步臨床評估。 PubMed DOI

研究比較了基於GPT-4的ChatGPT、基於GPT-4V的ChatGPT和放射科醫師在106個案例的肌肉骨骼放射學診斷準確性。結果顯示,基於GPT-4的ChatGPT準確率為43%,優於基於GPT-4V的ChatGPT的8%。放射科醫師的準確率分別為41%和53%。ChatGPT表現接近住院醫師,但不及認證放射科醫師。放射科醫師需了解ChatGPT的診斷表現,強調提供詳細影像描述以提高準確性。 PubMed DOI

單間室膝關節置換術(UKR)在末期單間室膝關節骨關節炎患者中越來越受重視,但選擇合適候選者仍有爭議。本研究探討了ChatGPT等自然語言處理程式在評估患者接受全膝關節置換術(TKR)或UKR資格的有效性。結果顯示,ChatGPT與73位外科醫生的意見僅有15.6%不合,且在識別UKR候選者方面的敏感性達0.91,正確預測值為0.87。此外,ChatGPT在決策中表現出更高的信心。研究顯示,ChatGPT能有效協助外科決策。 PubMed DOI

這項研究評估了ChatGPT 4.0在2019年骨科住院醫師訓練考試中的表現。結果顯示,ChatGPT在純文字問題的正確率為49%,而帶有圖片的問題為48%。當圖片描述由AI生成時,表現下降6%。整體來看,ChatGPT的表現低於所有住院醫師班級,尤其比一年級住院醫師低4%。研究指出,雖然ChatGPT在醫學考試中有一定能力,但仍未達到住院醫師的水準,顯示AI在醫學教育中的潛力與限制。 PubMed DOI

這項研究評估了ChatGPT-4.0o在放射影像定位品質的有效性,分析了30張不同關節的放射線影像。模型的任務是找出定位錯誤並提出改進建議。放射技術師根據標準對模型的回應進行1到5的評分。結果顯示,模型僅在20%的案例中正確識別所有錯誤,且最常見得分為3,表示至少識別一個錯誤,30%的影像中提供了正確建議。平均得分為2.9,顯示準確性較低,強調了教育背景和臨床經驗在放射學中的重要性。 PubMed DOI

這項研究評估了ChatGPT-4視覺版(GPT-4V)在解讀醫學影像及處理骨科創傷案例的表現。研究分析了十個來自OrthoBullets的熱門案例,並由四位專科醫生對AI的回應進行評分。結果顯示,GPT-4V在影像回應的平均得分為3.46,準確性和可信度較低,分別為3.28和3.15;而在管理問題上得分較高(3.76),治療問題表現最佳(4.04)。結論指出,GPT-4V作為教育工具有潛力,但影像解讀能力仍不及經驗豐富的醫生。 PubMed DOI

這項研究評估了ChatGPT在膝關節X光片識別脛骨平台骨折的準確性,分析了111張X光片,其中29例經CT確認為骨折。結果顯示,急診醫師和放射科醫師的表現明顯優於ChatGPT-4,尤其在敏感度上。雖然ChatGPT-4o在特異度上表現接近醫師,但整體診斷能力仍不及人類專家。總之,ChatGPT-4o顯示出潛力,但尚未達到醫師的診斷水準。 PubMed DOI

這項研究評估了ChatGPT 4.0在診斷常見骨科上肢骨病變的準確性,重點分析六種病症,包括遠端橈骨骨折和舟骨不癒合等。研究隨機選取了每種病症50張影像,並要求ChatGPT進行診斷。結果顯示,ChatGPT僅對52%的影像提供診斷,準確性從0%到55%不等,特別是舟骨和掌骨骨折的準確性較低。雖然其展現了一定的診斷能力,但表現不穩定,顯示需進一步開發以提升臨床應用的實用性。 PubMed DOI

這項研究評估了大型語言模型(LLMs)在僅依據患者報告的問卷數據來檢測髖關節或膝關節骨關節炎(OA)的診斷能力。115名患者填寫了有關症狀和病史的問卷,研究分析了多個LLMs的表現,結果顯示GPT-4o的診斷敏感性最高,達92.3%。雖然GPT-4的不同版本之間有中等一致性,但某些模型如Llama-3.1的準確性較低。研究強調醫療監督的重要性,並呼籲進一步研究以提升LLM的診斷能力。 PubMed DOI

本研究探討生成預訓練變壓器(ChatGPT)在放射影像中分類股骨轉子周圍骨折的準確性。研究結果顯示,ChatGPT能根據修訂的AO/OTA分類系統將骨折分為穩定(A1)和不穩定(A2),其分類一致性(κ = 0.420)與骨科醫生相似,顯示中等可靠性。這表明ChatGPT可有效整合進臨床工作流程,並在數據收集上需求較低,對醫療應用具潛力。 PubMed DOI