原始文章

這項研究評估了ChatGPT(3.5和4版本)在提供肩膀和肘部手術資訊的準確性,分析了114個問題。結果顯示,ChatGPT 3.5的正確率為52.3%,而ChatGPT 4則達到73.3%。雖然3.5在不穩定性類別表現較佳,但4在大多數其他類別中表現更優。兩者的表現都超過50%的熟練度,但仍無法取代臨床決策。研究建議進一步改善ChatGPT的訓練,以提升其作為醫療資訊資源的效用。 PubMed DOI


站上相關主題文章列表

這項研究評估了ChatGPT 3.5和4在回答骨科考試問題的表現,使用了來自首爾國立大學醫院的160道問題,分為11個子類別。結果顯示,ChatGPT 3.5的正確率為37.5%,而ChatGPT 4提升至60.0%(p < 0.001)。大部分類別中,ChatGPT 4表現較佳,唯獨在腫瘤相關問題上不如3.5。此外,ChatGPT 4的回答不一致率顯著低於3.5(9.4%對比47.5%)。雖然ChatGPT 4在骨科考試中表現不錯,但仍需謹慎對待其不一致的回答和錯誤解釋。 PubMed DOI

這項研究評估了ChatGPT 3.5在回答有關全踝關節置換手術的病人常見問題上的表現。兩位踝關節外科醫生選了十個常見問題,分析了ChatGPT的回答準確性和清晰度。結果顯示,大部分回答被評為優秀或滿意,幾乎不需進一步澄清。準確性得分為2,表示滿意,而修訂後的DISCERN得分平均為51,顯示出良好到一般的質量。總體而言,ChatGPT在提供全踝關節置換手術資訊方面顯示出潛力,但仍需進一步研究以了解其在病人溝通和臨床實踐中的角色。 PubMed DOI

這項研究評估了ChatGPT在回答小兒肱骨上髁骨折相關問題的效果。研究中提出七個常見問題,並根據回答的清晰度和準確性進行分類。結果顯示,四個回答雖然滿意,但仍需澄清;三個則不滿意,缺乏準確性和清晰度。沒有任何回答被評為優秀。研究指出,ChatGPT提供的資訊雖有幫助,但通常需要進一步澄清,特別是在治療方案上。因此,建議家長應諮詢醫療專業人員以獲得準確指導。這項評估屬於五級專家意見。 PubMed DOI

本研究比較了ChatGPT4.0與3.5在手外科影像問題上的表現,發現兩者在正確率上無顯著差異(分別為30.1%和28.7%)。雖然ChatGPT4.0提供的解釋較長,但對答案的信心卻較低,尤其在放射影像問題上表現出更高的不確定性。未來研究應探討AI生成的回答如何影響臨床與教育環境中的行為,以促進AI在醫療中的應用。 PubMed DOI

這項研究評估了ChatGPT在凍結肩患者資訊提供上的有效性。五位醫師針對十四個肌肉骨骼疾病的關鍵問題,與120位患者進行諮詢,並使用5點李克特量表評估ChatGPT 4.0的回應。結果顯示,85.7%的回應獲得5分,92.9%的回應在安全性上也得分高。整體來看,ChatGPT提供的資訊有效、安全且實用,但使用者仍需謹慎,並不應取代專業醫療建議,定期更新資訊也很重要。 PubMed DOI

這項研究評估了ChatGPT對旋轉袖撕裂病人常見問題的回答能力,並比較了標準與六年級閱讀水平的回應。結果顯示,標準回應在準確性(4.7)和適當性(4.5)上優於六年級回應(3.6和3.7),且差異顯著(P < 0.001)。不過,標準回應的準確性和適當性仍低於OrthoInfo(準確性4.7對5.0,適當性4.5對5.0)。雖然標準回應較佳,但可讀性卻不如OrthoInfo。結論建議,ChatGPT不應作為病人資訊的唯一來源,但可作為骨科醫生資訊的補充。 PubMed DOI

這項研究評估了手部手術相關的線上醫療資訊,並比較了Google、ChatGPT-3.5和ChatGPT-4.0的回應。研究針對腕隧道症候群、網球肘和富血小板血漿用於拇指關節炎三個問題進行分析。 主要發現包括: 1. **可讀性**:Google的回應較易讀,平均在八年級水平,而ChatGPT則在大學二年級水平。低共識主題的可讀性普遍較差。 2. **可靠性與準確性**:ChatGPT-4的可靠性與3.5相似,但低共識主題的可讀性較低,準確性差異不大。 3. **覆蓋範圍**:ChatGPT-4和Google在疾病原因和程序細節的覆蓋上有所不同,但在解剖學和病理生理學上相似。 總結來說,雖然ChatGPT能提供可靠的醫療資訊,但可讀性較差,醫療提供者需注意其局限性。 PubMed DOI

這項研究發現,ChatGPT-4o在回答鎖骨中段骨折問題時,常混合正確與錯誤資訊,且多數引用的文獻都是假的或錯誤的。整體來說,ChatGPT在這方面的準確性和可靠性有限,建議臨床應用前要特別小心評估風險。 PubMed DOI

這項研究發現,ChatGPT在回答肩關節置換手術常見問題時,只有一題被評為「優秀」,其他答案雖然還可以,但都不夠詳細。ChatGPT適合用來幫助病人和醫師溝通,但在治療細節和正確性上還有待加強。建議把它當作輔助工具,不能取代專業醫療意見,使用時也要有專業監督。 PubMed DOI

這項研究發現,ChatGPT-4在回答關節置換相關問題時,正確率只有66.9%,明顯低於骨科研究員和主治醫師。特別是在有圖片的題目上,表現更差。雖然ChatGPT可當作學習輔助,但還無法取代專業醫師的臨床判斷,未來還需更多研究來提升AI在醫療領域的應用。 PubMed DOI