原始文章

這項研究評估了GPT-4在解讀美國和中國骨關節炎治療指導方針的能力,以及在骨科病例診斷和管理上的有效性。研究結果顯示,GPT-4對指導方針的正確匹配率為46.4%,準確度得分為4.3±1.6,完整性得分為2.8±0.6。在模擬案例中,超過88%的回應被認為是全面的。總體來看,GPT-4在骨科實踐和病人教育上有潛力,但在臨床應用上仍需進一步驗證。 PubMed DOI


站上相關主題文章列表

OpenAI最新的AI模型GPT-4在醫學應用特別是骨科方面有顯著進展。研究顯示,GPT-4在回答骨科問題時比GPT-3.5更準確,接近骨科住院醫師水準,甚至超越普通實習生。這顯示AI模型的進步,未來可能在臨床上有更廣泛的應用。 PubMed DOI

研究發現GPT-4在臨床磁振造影報告中對膝蓋和肩膀骨科疾病治療提供了部分正確且實用的建議,但仍有限制。醫護人員在使用語言模型建議時,應提供批判性指導,因為建議可能不適合獨立患者使用,需要準確的數據輸入。 PubMed DOI

研究探討使用GPT-3.5 Turbo和GPT-4等AI模型進行骨科培訓考試。結果顯示,GPT-4在準確性和問題類型上優於GPT-3.5 Turbo,顯示AI在骨科領域有潛力。然而,目前AI無法取代骨科培訓,顯示醫學領域需要專門的AI培訓。 PubMed DOI

研究測試了ChatGPT-4在處理膝疼痛投訴、提供不同診斷和治療方案的表現。ChatGPT-4的診斷通常準確,與專業醫師看法一致。當提供更多資訊時,ChatGPT-4的準確性提高,有時甚至達到100%。它提供了合理的診斷和治療建議,但也可能有錯誤,需要進一步臨床評估。 PubMed DOI

這項研究探討了GPT-4作為手外科門診的諮詢助手,模擬了10種常見手部疾病的病人情境。GPT-4進行病史訪談,並利用提示工程技術協助診斷。專業手外科醫生用李克特量表評估其表現,平均得分為4.6,顯示在病史記錄上表現不錯。研究建議GPT-4可能成為病人照護的有用工具,但仍需進一步研究以確認其在真實臨床環境中的有效性。 PubMed DOI

這項研究評估了ChatGPT 3.5和4在回答骨科考試問題的表現,使用了來自首爾國立大學醫院的160道問題,分為11個子類別。結果顯示,ChatGPT 3.5的正確率為37.5%,而ChatGPT 4提升至60.0%(p < 0.001)。大部分類別中,ChatGPT 4表現較佳,唯獨在腫瘤相關問題上不如3.5。此外,ChatGPT 4的回答不一致率顯著低於3.5(9.4%對比47.5%)。雖然ChatGPT 4在骨科考試中表現不錯,但仍需謹慎對待其不一致的回答和錯誤解釋。 PubMed DOI

這項研究評估了ChatGPT-4在生成骨科疾病治療建議的有效性,並與美國骨科醫學會的指導方針及醫師計畫進行比較。主要發現包括: 1. ChatGPT-4的建議與AAOS指導方針一致性達90%。 2. 與主治醫師的建議一致性為78%。 3. 在骨折及關節炎案例中表現優異,但腕管綜合症表現不佳。 4. 不一致主要出現在腕管綜合症及其他特定損傷。 5. 雖然ChatGPT-4能提供準確建議,但在考量患者特定因素時仍需醫師的批判性評估。 總之,ChatGPT-4在骨科治療中具輔助潛力,但需專業監督。 PubMed DOI

這項研究評估了ChatGPT-4視覺版(GPT-4V)在解讀醫學影像及處理骨科創傷案例的表現。研究分析了十個來自OrthoBullets的熱門案例,並由四位專科醫生對AI的回應進行評分。結果顯示,GPT-4V在影像回應的平均得分為3.46,準確性和可信度較低,分別為3.28和3.15;而在管理問題上得分較高(3.76),治療問題表現最佳(4.04)。結論指出,GPT-4V作為教育工具有潛力,但影像解讀能力仍不及經驗豐富的醫生。 PubMed DOI

這項研究評估了三個大型語言模型(LLMs)—ChatGPT-3.5、ChatGPT-4.0 和 Perplexity—在回答骨關節炎(OA)相關問題的準確性。研究將25個問題分為六個主題,並由三位骨科專家進行評分。結果顯示,ChatGPT-4.0的表現最佳,64%的回答被評為「優秀」,而ChatGPT-3.5和Perplexity分別為40%和28%。雖然所有模型的整體評分都很高,但在「治療與預防」方面表現較弱。這項研究顯示了大型語言模型的潛力,特別是ChatGPT-4.0在提供OA資訊上的準確性。 PubMed DOI

這項研究評估了GPT-4在回答疼痛管理相關的臨床藥理學問題上的表現。醫療專業人員提出了有關藥物相互作用、劑量和禁忌症的問題,GPT-4的回應在清晰度、詳細程度和醫學準確性上獲得了高評價。結果顯示,99%的參與者認為回應易懂,84%認為信息詳細,93%表示滿意,96%認為醫學準確。不過,只有63%認為信息完整,顯示在藥物動力學和相互作用方面仍有不足。研究建議開發專門的AI工具,結合即時藥理數據庫,以提升臨床決策的準確性。 PubMed DOI