原始文章

這項研究發現,ChatGPT-4.0在回答先天性上肢差異常見問題時,大約一半答案正確且清楚,但有8%內容不夠好或可能誤導。回答內容深度和完整性不一,且很少建議諮詢專業醫師。總結來說,ChatGPT提供的資訊大致可靠,但不夠全面或個人化,建議病人衛教時要小心使用。 PubMed DOI


站上相關主題文章列表

這項研究評估了ChatGPT-4在回答有關尺側韌帶(UCL)損傷的問題時的有效性,並與Google進行比較。研究發現,ChatGPT-4的學術來源比例高達90%,而Google僅50%。兩者在常見問題上有40%的重疊,但在數字回答中,只有20%的答案完全相同。ChatGPT-4的答案準確性顯著高於Google,顯示其在提供臨床相關資訊方面的潛力。不過,在完全應用於臨床前,仍需進一步驗證。 PubMed DOI

這項研究評估了ChatGPT 3.5和4.0在回答有關Tommy John手術的病人問題時的資訊品質。研究者提出了25個問題,並用可讀性指標來評估回應。結果顯示,兩個版本的回應教育水平都高於病人能理解的範圍,且ChatGPT 4.0的表現稍好,但語言複雜性可能影響病人的理解。這強調了了解AI平台限制的重要性,因為未來這些平台將更廣泛地服務公眾。 PubMed DOI

這項研究評估了三個AI聊天機器人—ChatGPT、Google Bard和Microsoft Copilot—在小兒骨科肢體重建手術問題上的回答準確性。研究者提出23個常見問題,並由三位骨科醫生用4分制評分。結果顯示,ChatGPT的回答最準確,評價為令人滿意,幾乎不需澄清;而Microsoft Copilot的回答準確性最低,需要中等程度的澄清。這顯示在醫療領域,特別是專業領域,聊天機器人的信息可靠性有差異。 PubMed DOI

這項研究評估了兩個AI平台(Gemini和ChatGPT)對手部和手腕手術常見問題的回答質量。共提出12個問題,分析48個回答,使用三種評分工具進行評估。結果顯示,回答的平均分數為55.7(良好)、57.2%(足夠)和4.4。手腕相關問題的回答質量顯著高於手部問題,且Gemini在評分上優於ChatGPT。雖然AI的回答通常被評為良好,但質量因平台和問題類型而異,了解這些差異對病人尋求資訊至關重要。 PubMed DOI

這項研究評估了ChatGPT在回答小兒肱骨上髁骨折相關問題的效果。研究中提出七個常見問題,並根據回答的清晰度和準確性進行分類。結果顯示,四個回答雖然滿意,但仍需澄清;三個則不滿意,缺乏準確性和清晰度。沒有任何回答被評為優秀。研究指出,ChatGPT提供的資訊雖有幫助,但通常需要進一步澄清,特別是在治療方案上。因此,建議家長應諮詢醫療專業人員以獲得準確指導。這項評估屬於五級專家意見。 PubMed DOI

本研究探討ChatGPT在唇裂修復方面的回應質量與準確性,因為大型語言模型在健康資訊傳播中越來越常見。研究選取十個常見問題,並由五位整形外科醫師評估其內容質量、清晰度、相關性和可信度。結果顯示,ChatGPT的平均評分為2.9分,清晰度和內容質量較高,但可信度較低。可讀性適合約10年級學生。雖然回應中無明顯不準確或有害資訊,但缺乏引用來源,使用者需注意其局限性。 PubMed DOI

這項研究評估了手部手術相關的線上醫療資訊,並比較了Google、ChatGPT-3.5和ChatGPT-4.0的回應。研究針對腕隧道症候群、網球肘和富血小板血漿用於拇指關節炎三個問題進行分析。 主要發現包括: 1. **可讀性**:Google的回應較易讀,平均在八年級水平,而ChatGPT則在大學二年級水平。低共識主題的可讀性普遍較差。 2. **可靠性與準確性**:ChatGPT-4的可靠性與3.5相似,但低共識主題的可讀性較低,準確性差異不大。 3. **覆蓋範圍**:ChatGPT-4和Google在疾病原因和程序細節的覆蓋上有所不同,但在解剖學和病理生理學上相似。 總結來說,雖然ChatGPT能提供可靠的醫療資訊,但可讀性較差,醫療提供者需注意其局限性。 PubMed DOI

這項研究發現,ChatGPT-4回答板機指手術相關問題時,大多內容正確且表達清楚,但偶爾會有事實錯誤,尤其在治療部分。AI的回答閱讀難度偏高,約等同高中三年級,超過建議給病人的國中程度。建議AI可作為衛教輔助,但醫護人員仍需協助病人確認資訊正確性。 PubMed DOI

這項研究發現,ChatGPT在回答肩關節置換手術常見問題時,只有一題被評為「優秀」,其他答案雖然還可以,但都不夠詳細。ChatGPT適合用來幫助病人和醫師溝通,但在治療細節和正確性上還有待加強。建議把它當作輔助工具,不能取代專業醫療意見,使用時也要有專業監督。 PubMed DOI

這項研究發現,AI 聊天機器人(像是ChatGPT、Copilot等)在回答兒童下頜骨延長術常見照護問題時,雖然Copilot表現最好,但整體來說,答案不夠可靠、資料來源不足,而且用詞太艱深,病人和家屬很難看懂,暫時還不適合當作醫療諮詢的主要工具。 PubMed DOI