原始文章

這項研究評估了ChatGPT在回答有關觸發指的病人問題的有效性,目的是改善病人教育並探討人工智慧的角色。研究人員整理了十個常見問題,並根據《美國醫學會雜誌》(JAMA)和DISCERN工具的標準評估ChatGPT的回答。結果顯示,ChatGPT的回答質量中等,60%被認為滿意,但40%有缺陷,主要是缺乏科學參考資料。此外,回答的可讀性達到大學水平,對健康素養較低的病人來說理解上有挑戰。結論指出,雖然ChatGPT能提供一般資訊,但在作為病人主要教育資源前,需專家監督。這是首個專門檢視ChatGPT在觸發指情境中的研究。 PubMed DOI


站上相關主題文章列表

這項研究評估了兩個AI平台(Gemini和ChatGPT)對手部和手腕手術常見問題的回答質量。共提出12個問題,分析48個回答,使用三種評分工具進行評估。結果顯示,回答的平均分數為55.7(良好)、57.2%(足夠)和4.4。手腕相關問題的回答質量顯著高於手部問題,且Gemini在評分上優於ChatGPT。雖然AI的回答通常被評為良好,但質量因平台和問題類型而異,了解這些差異對病人尋求資訊至關重要。 PubMed DOI

這項研究評估了ChatGPT(3.5和4版本)在提供肩膀和肘部手術資訊的準確性,分析了114個問題。結果顯示,ChatGPT 3.5的正確率為52.3%,而ChatGPT 4則達到73.3%。雖然3.5在不穩定性類別表現較佳,但4在大多數其他類別中表現更優。兩者的表現都超過50%的熟練度,但仍無法取代臨床決策。研究建議進一步改善ChatGPT的訓練,以提升其作為醫療資訊資源的效用。 PubMed DOI

這項研究評估了ChatGPT 3.5和4.0生成的病人教育材料(PEMs)在可讀性上的表現,針對常見手部疾病進行分析。研究發現,ChatGPT 4.0在啟發階段後,有28%的內容達到六年級閱讀水平,而3.5則沒有生成合適的內容。整體來看,4.0在所有可讀性指標上均優於3.5,顯示出其在提升病人教育和健康素養方面的潛力,未來隨著進一步改進,這一潛力將更為明顯。 PubMed DOI

這項研究評估了ChatGPT在凍結肩患者資訊提供上的有效性。五位醫師針對十四個肌肉骨骼疾病的關鍵問題,與120位患者進行諮詢,並使用5點李克特量表評估ChatGPT 4.0的回應。結果顯示,85.7%的回應獲得5分,92.9%的回應在安全性上也得分高。整體來看,ChatGPT提供的資訊有效、安全且實用,但使用者仍需謹慎,並不應取代專業醫療建議,定期更新資訊也很重要。 PubMed DOI

這項研究探討了ChatGPT 4.0作為手部疾病初步診斷工具的有效性,涵蓋了觸發指、杜普伊特氏攣縮、腕管症候群等疾病。結果顯示,GPT-4.0對大多數疾病的診斷準確率超過95%,但拇指掌腕關節骨關節炎的準確率僅60%。在97%的案例中,GPT-4.0建議患者尋求醫療協助。研究也分析了其使用的術語,發現某些疾病之間有重疊。總體來看,GPT-4.0作為診斷輔助工具有潛力,但仍需進一步研究以提升準確性。 PubMed DOI

這項研究評估了手部手術相關的線上醫療資訊,並比較了Google、ChatGPT-3.5和ChatGPT-4.0的回應。研究針對腕隧道症候群、網球肘和富血小板血漿用於拇指關節炎三個問題進行分析。 主要發現包括: 1. **可讀性**:Google的回應較易讀,平均在八年級水平,而ChatGPT則在大學二年級水平。低共識主題的可讀性普遍較差。 2. **可靠性與準確性**:ChatGPT-4的可靠性與3.5相似,但低共識主題的可讀性較低,準確性差異不大。 3. **覆蓋範圍**:ChatGPT-4和Google在疾病原因和程序細節的覆蓋上有所不同,但在解剖學和病理生理學上相似。 總結來說,雖然ChatGPT能提供可靠的醫療資訊,但可讀性較差,醫療提供者需注意其局限性。 PubMed DOI

這項研究比較三款AI聊天機器人回答腕隧道症候群相關問題的表現。ChatGPT-4o 回答最詳細,但 AMBOSS GPT 的答案最常被 UpToDate 證實,正確率最高。總結來說,GPT-4o 資訊多,AMBOSS GPT 則較可靠。 PubMed DOI

這項研究發現,ChatGPT-4回答板機指手術相關問題時,大多內容正確且表達清楚,但偶爾會有事實錯誤,尤其在治療部分。AI的回答閱讀難度偏高,約等同高中三年級,超過建議給病人的國中程度。建議AI可作為衛教輔助,但醫護人員仍需協助病人確認資訊正確性。 PubMed DOI

這項研究發現,ChatGPT在回答肩關節置換手術常見問題時,只有一題被評為「優秀」,其他答案雖然還可以,但都不夠詳細。ChatGPT適合用來幫助病人和醫師溝通,但在治療細節和正確性上還有待加強。建議把它當作輔助工具,不能取代專業醫療意見,使用時也要有專業監督。 PubMed DOI

這項研究發現,ChatGPT-4.0在回答先天性上肢差異常見問題時,大約一半答案正確且清楚,但有8%內容不夠好或可能誤導。回答內容深度和完整性不一,且很少建議諮詢專業醫師。總結來說,ChatGPT提供的資訊大致可靠,但不夠全面或個人化,建議病人衛教時要小心使用。 PubMed DOI