Role of Generative Artificial Intelligence in Assisting Systematic Review Process in Health Research: A Systematic Review.

生成式人工智慧在協助健康研究系統性文獻回顧流程中的角色：系統性文獻回顧

<think> 嗯，我现在要分析这个关于生成式人工智能在系统综述中作用的研究。首先，我得仔细看看标题和摘要，理解研究的主要内容。标题是“生成式人工智能在协助健康研究系统综述过程中的作用：一项系统综述”，看来他们是在评估AI在系统综述中的表现。研究目的部分，他们想总结生成式AI在系统综述中的性能指标。所以他们的假设应该是生成式AI在某些阶段比人类或其他工具更有效率或准确。摘要里提到他们搜索了多个数据库，筛选了30项研究，使用了ChatGPT、Bard等工具。结果显示AI在某些环节有效，但在文献搜索和研究选择上可靠性不一致，可能推荐文章不相关，结果不一致。风险偏好评估方面证据不一，部分研究质量高，但整体还需要更多验证才能全面应用。接下来，我得从六个角度分析：研究目的、方法、数据解释、局限性、临床意义和其他观点。研究目的明确，想评估AI在系统综述中的效果，假设是AI在某些方面表现良好。方法上，他们用了系统综述，搜索多个数据库，筛选了实验性研究，这些都是合理的，但可能缺乏长期跟踪，或者过于依赖特定AI工具。数据解释方面，AI在PICO部分和数据提取好，但文献搜索和研究选择不行，可能因为AI理解能力有限。风险偏好评估的结果不一，可能因为评估标准不同。局限性方面，研究可能只覆盖了部分数据库，可能有出版偏差，或者缺乏长期效果评估。另外，AI工具本身的更新可能影响结果。临床意义上，AI可以辅助综述，但不能完全替代人类，特别是在关键步骤上。未来的研究可能需要更全面评估AI的长期效果，考虑不同工具和领域的差异。其他观点的话，可能AI在特定领域更好，或者需要结合人类判断使用。另外，研究可能忽略了AI在其他环节的潜力，或者不同AI模型之间的差异。总的来说，这个研究提供了有用的见解，但仍有改进空间，特别是在标准化评估和长期应用方面。 </think> ### 觀點分析 #### 1. 研究目的與假設研究旨在探討生成式人工智慧（GAI）在系統性回顧（SR）過程中的性能指標。研究假設GAI在SR的某些階段（如研究選擇、資料提取等）可能比人類或其他工具更有效率或更準確。摘要中提到，GAI在參與者、介入措施、對比和結果的制定以及資料提取方面表现良好，但在文獻搜索和研究選擇方面可靠性不一致，可能會檢索到不相關的文章並產生不一致的結果。 #### 2. 方法與設計研究採用系統性回顧的方法，搜索了PubMed、EMBASE、Scopus和ProQuest Dissertations & Theses Global等數據庫，篩選了30項研究。這種方法合理，因為系統性回顧是一種系統化的文獻搜索和綜合方法，能夠提供全面的證據。優點包括涵蓋範圍廣、篩選標準明確。潛在缺陷可能在於研究質量的評估僅限於研究選擇過程，未能全面評估其他階段的質量。 #### 3. 數據解釋與結果研究結果顯示，GAI在參與者、介入措施、對比和結果的制定以及資料提取方面有效，但在文獻搜索和研究選擇方面表现不佳。這些結果部分支持研究假設，但也揭示了GAI在某些任務上的局限性。解釋上的偏差可能源於GAI在文獻搜索和研究選擇時的不一致結果，這可能與GAI的演算法或訓練數據有關。 #### 4. 局限性與偏見研究可能存在的局限性包括數據庫的選擇範圍有限，可能導致某些相關研究被忽略。此外，研究主要集中在GAI工具如ChatGPT、Bard和Microsoft Bing AI，可能未能考慮到其他GAI工具的性能差異。未考慮到的偏見可能包括研究選擇的標準可能不夠全面，導致某些研究被排除在外。 #### 5. 臨床及未來研究意涵研究結果表明，GAI在某些SR階段具有潛力，但尚未成熟到可以完全取代人類的水平。未來研究可以進一步探討GAI在不同SR階段的長期效果，並考慮更多GAI工具和應用場景。此外，標準化的GAI評估框架可能有助於提高SR的質量和一致性。 #### 6. 其他觀點其他可能的解釋或觀點包括GAI在特定領域或任務中表现更佳，或者GAI的性能可能隨著演算法的改進而提升。研究結果可能受到GAI工具的訓練數據和演算法的影響，因此未來研究可以進一步探討這些因素對GAI性能的影響。