Comparison of the Usability and Reliability of Answers to Clinical Questions: AI-Generated ChatGPT versus a Human-Authored Resource.
臨床問題答案的可用性和可靠性比較：AI 生成的 ChatGPT 與人類撰寫的資源。 South Med J 2024-08-02

這項研究評估了ChatGPT對臨床問題的回答，與人類撰寫的網站Pearls4Peers.com進行比較，重點在可用性和可靠性。研究發現，ChatGPT的回答質量有顯著差異，約14%的回答被認為不實用，13%不準確。與人類來源相比，ChatGPT在可用性和可靠性方面的表現均不佳，超過30%的情況下表現不如人類。總體來看，這顯示在臨床決策中使用ChatGPT需謹慎。 PubMed DOI

ChatGPT as a Source for Patient Information on Patellofemoral Surgery-A Comparative Study Amongst Laymen, Doctors, and Experts.
ChatGPT 作為髕股關節手術患者資訊的來源 - 一項普通人、醫生與專家之間的比較研究。 Clin Pract 2024-11-25

2022年11月，OpenAI推出了ChatGPT，引發了對其在醫學領域有效性的討論。研究專注於ChatGPT對髕股疼痛的回答能力，並比較一般民眾、非骨科醫生及專家的評價。使用12個問題進行評估，結果顯示專家對ChatGPT的評分普遍較低，尤其在複雜問題上。雖然ChatGPT提供的資訊質量不錯，但隨著問題複雜度增加，其表現下降，顯示出人類專業知識在醫療中的重要性。 PubMed DOI

Is ChatGPT a Reliable Tool for Explaining Medical Terms?
ChatGPT 是否是一個可靠的工具來解釋醫學術語？ Cureus 2025-02-11

這項研究探討了ChatGPT-4在將醫學術語翻譯成病人易懂語言的效果，並與不同醫師群體進行比較。研究評估了105個醫學術語，結果顯示ChatGPT-4的準確率達到100%，超過專科醫師（98.1%）、住院醫師（93.3%）和一般醫師（84.8%）。這些差異具有統計學意義，顯示ChatGPT-4在病人教育上是個可靠工具。不過，研究也強調醫療專業人員在臨床決策中的重要性仍不可或缺。 PubMed DOI

ChatGPT versus physician-derived answers to drug-related questions.
ChatGPT 與醫師提供的藥物相關問題答案的比較。 Dan Med J 2025-02-12

這項研究評估了ChatGPT 3.5和4.0在藥物諮詢服務中的表現。結果顯示，ChatGPT 3.5在80%的案例中提供了不錯的答案，而ChatGPT 4.0的表現更佳，98%的回應與醫生的回答相似或更好。不過，兩者的回應都缺乏參考文獻，有時也未能充分解決臨床相關問題。雖然ChatGPT 4.0的答案品質相當高，但在提供參考和臨床解釋方面的不足，顯示它不太適合成為臨床環境中的主要資訊來源。 PubMed DOI

ChatGPT-4 as an Assistant for Evidence-Based Decision-Making Among General Dentists: An Observational Feasibility Study.
ChatGPT-4 作為一般牙醫證據基礎決策的助手：一項觀察性可行性研究。 Cureus 2025-02-27

這項研究探討了ChatGPT-4在牙科領域進行基於證據的決策的可行性。兩位牙醫與ChatGPT-4互動，分析五個臨床情境，並參考Cochrane、ADA和PubMed的文獻。結果顯示，ChatGPT-4表現穩定，能有效識別相關證據並提供摘要，節省臨床醫師的時間。不過，它無法提供直接的網頁連結到引用的文章，這是個限制。總體而言，ChatGPT-4在EBDM中顯示出潛力，但臨床醫師仍需負責評估證據和做出決策。 PubMed DOI

Ability of ChatGPT to Replace Doctors in Patient Education: Cross-Sectional Comparative Analysis of Inflammatory Bowel Disease.
ChatGPT 在病人教育中取代醫生的能力：炎症性腸病的橫斷面比較分析。 J Med Internet Res 2025-03-31

這項研究評估了ChatGPT在提供慢性疾病患者教育方面的表現，特別針對炎症性腸病（IBD），並與專科醫生的回應進行比較。結果顯示，ChatGPT的整體品質評分與專科醫生相似，且在信息完整性上有明顯優勢。雖然準確性無顯著差異，但在患者和醫生共同回應時，ChatGPT表現較差。研究建議在健康信息創建和評估中，應納入患者的參與，以提升質量和相關性。 PubMed DOI

Assessing the Usability of ChatGPT Responses Compared to Other Online Information in Hand Surgery.
評估 ChatGPT 回應的可用性與其他線上資訊在手外科中的比較。 Hand (N Y) 2025-04-12

這項研究評估了手部手術相關的線上醫療資訊，並比較了Google、ChatGPT-3.5和ChatGPT-4.0的回應。研究針對腕隧道症候群、網球肘和富血小板血漿用於拇指關節炎三個問題進行分析。主要發現包括： 1. **可讀性**：Google的回應較易讀，平均在八年級水平，而ChatGPT則在大學二年級水平。低共識主題的可讀性普遍較差。 2. **可靠性與準確性**：ChatGPT-4的可靠性與3.5相似，但低共識主題的可讀性較低，準確性差異不大。 3. **覆蓋範圍**：ChatGPT-4和Google在疾病原因和程序細節的覆蓋上有所不同，但在解剖學和病理生理學上相似。總結來說，雖然ChatGPT能提供可靠的醫療資訊，但可讀性較差，醫療提供者需注意其局限性。 PubMed DOI

Assessing ChatGPT 4.0's Capabilities in the United Kingdom Medical Licensing Examination (UKMLA): A Robust Categorical Analysis.
ChatGPT 4.0 在英國醫學執照考試（UKMLA）中的能力評估：一項嚴謹的類別分析 Sci Rep 2025-04-15

這項研究發現，ChatGPT-4在有選擇題選項時，答對率超過86%，但沒選項時最低只有61.5%。它在管理問題上比診斷問題更容易出錯。雖然GPT-4能處理臨床資訊，但不是真的懂臨床情境。未來如果和專業醫療人員搭配，有機會幫助臨床工作，但還需要更多測試來確保安全和有效。 PubMed DOI

ChatGPT MAY PROVIDE ACCURATE MEDICAL AND DENTAL RESPONSES, THOUGH VARIABILITIES EXIST.
ChatGPT 可能提供準確的醫學與牙醫相關回應，但仍存在差異性。 J Evid Based Dent Pract 2025-05-07

Bagde 等人（2023）系統性回顧發現，ChatGPT 在醫學和牙醫領域的研究、教育及臨床決策上有潛力，但目前仍有準確性、可靠性和倫理等問題待解決，需更多高品質研究來驗證其效益。 PubMed DOI

ChatGPT as a rising force: Can AI bridge information gaps in Occupational Risk Prevention?
ChatGPT 崛起的新勢力：AI 能否彌補職業風險預防中的資訊落差？ Work 2025-06-13

這項研究比較了ChatGPT-3.5和4在職業風險預防選擇題的表現，GPT-3.5正確率56.8%，GPT-4為73.9%。兩者在專業題目上都容易出錯，且錯誤類型相似。雖然GPT-4表現較好，但在職業健康領域應用上仍有限。建議持續驗證、訓練和針對地區調整，以提升可靠度。 PubMed DOI

原始文章

站上相關主題文章列表