ChatGPT-4o can serve as the second rater for data extraction in systematic reviews.
ChatGPT-4o 可作為系統評價中數據提取的第二評估者。 PLoS One 2025-01-08

這項研究評估了ChatGPT-4o在系統性回顧中提取數據的效果，並與人類審稿人進行比較。研究聚焦於運動與跌倒風險降低的相關論文。結果顯示，ChatGPT-4o的數據提取準確率高達92.4%，錯誤率僅5.2%。其數據提取的重現性也很強，兩次獨立會議的協議率達94.1%，但若論文缺少資訊，這個比例會降到77.2%。總體來看，ChatGPT-4o是一個可靠的數據提取工具，未來在數據總結方面有潛力發展。 PubMed DOI

Using artificial intelligence to semi-automate trustworthiness assessment of randomized controlled trials: A case study.
使用人工智慧半自動化隨機對照試驗的可信度評估：案例研究。 J Clin Epidemiol 2025-01-19

隨機對照試驗（RCTs）對循證醫學非常重要，但有些試驗使用虛構數據，影響研究的完整性。本研究探討利用GPT-4驅動的ChatGPT來簡化RCT評估過程。透過TRACT檢查表，ChatGPT能有效處理RCT論文的PDF，並準確回答檢查項目，與人類評估者的一致性達84%。此外，ChatGPT在數據提取方面也表現出色，對三個表格達到100%準確率。未來將致力於提升ChatGPT在多個RCT中的應用，實現更高的數據捕捉準確性及自動化處理。 PubMed DOI

Collaborative large language models for automated data extraction in living systematic reviews.
用於自動數據提取的協作大型語言模型在活系統評價中的應用。 J Am Med Inform Assoc 2025-01-21

這項研究探討如何利用大型語言模型（LLMs）自動化提取生活系統性回顧（LSRs）中的數據，模擬兩位審稿人的流程。分析了來自10個試驗的數據，針對23個變數進行研究。使用的模型包括GPT-4-turbo和Claude-3-Opus。結果顯示，在提示開發集中，模型達到96%的高一致性率，但在測試集中降至87%。經過交叉評析後，51%的不一致回應變得一致，整體準確率提升至0.76。研究表明，LLMs能有效支持數據提取，促進系統性回顧的進行。 PubMed DOI

AI-driven evidence synthesis: data extraction of randomized controlled trials with large language models.
AI 驅動的證據綜合：使用大型語言模型進行隨機對照試驗的數據提取。 Int J Surg 2025-02-04

這篇研究指出大型語言模型（LLMs）在提升證據綜合效率方面的潛力，特別是在隨機對照試驗（RCTs）的數據提取上。作者針對LLMs開發了結構化提示，使用Claude（Claude-2），涵蓋了Cochrane手冊的六大領域共58項內容。他們在10個已發表的Cochrane評論RCT上測試，結果顯示數據提取準確率高達94.77%，各領域準確率介於77.97%到100%之間，且每個RCT的提取時間僅需88秒。這些結果顯示結構化提示能有效增強LLMs在系統性回顧中的應用，對證據綜合方法學是一大進步。 PubMed DOI

Human versus artificial intelligence: evaluating ChatGPT's performance in conducting published systematic reviews with meta-analysis in chronic pain research.
人類與人工智慧：評估 ChatGPT 在慢性疼痛研究中進行已發表的系統性回顧與統合分析的表現。 Reg Anesth Pain Med 2025-02-16

這項研究評估了大型語言模型ChatGPT在系統性回顧和統合分析中的表現，特別是在脊髓刺激後情緒功能的數據上。結果顯示，ChatGPT在標題和摘要篩選的準確率為70.4%，而全文篩選的準確率為68.4%。在數據整合方面，ChatGPT的準確率達到100%。雖然在篩選任務中表現中等，但在數據整合上表現優異。研究指出，人工智慧能提升系統性回顧的效率，但仍需人類監督以確保研究質量。 PubMed DOI

Enhancing systematic literature reviews with generative artificial intelligence: development, applications, and performance evaluation.
利用生成式人工智慧增強系統性文獻回顧：發展、應用及效能評估。 J Am Med Inform Assoc 2025-03-04

您開發了一個大型語言模型（LLM）輔助的系統，專門用於健康技術評估（HTA）的系統性文獻回顧（SLR）。這個系統包含五個模組，從文獻搜尋到數據總結，並具有人機協作的設計，能根據LLM與人類審查者的意見調整PICOs標準。經過四組數據評估，系統在摘要篩選中表現優異，達到90%的敏感度和82的F1分數，顯示出與人類審查者的高一致性。這個AI輔助系統有潛力簡化SLR過程，降低時間和成本，並提升證據生成的準確性。 PubMed DOI

Novel AI applications in systematic review: GPT-4 assisted data extraction, analysis, review of bias.
系統性回顧中的新型 AI 應用：GPT-4 協助的數據提取、分析及偏見審查。 BMJ Evid Based Med 2025-04-08

這項研究評估了自訂的GPT-4模型在醫學文獻數據提取和評估方面的表現，以協助系統性回顧。研究團隊創建了四個專門模型，針對研究特徵、結果、偏見評估及風險評估進行分析。結果顯示，GPT-4在數據提取的符合率達88.6%，且在2.5%的情況下準確性超過人類評審。在偏見評估方面，GPT-4的內部一致性公平至中等，外部一致性則優於人類評審者。整體而言，GPT-4在系統性回顧中展現出潛在的應用價值。 PubMed DOI

AI-assisted evidence screening method for systematic reviews in environmental research: integrating ChatGPT with domain knowledge.
環境研究中系統評價的AI輔助證據篩選方法：將ChatGPT與領域知識整合。 Environ Evid 2025-04-14

環境科學中的系統性回顧面臨挑戰，因為不同學科的方法和術語不一致，影響證據篩選的透明度和可重複性。為了解決這個問題，我們開發了一個AI輔助的證據篩選框架，並以溪流糞便大腸桿菌濃度與土地使用的關係為案例。透過微調ChatGPT-3.5 Turbo模型，我們在篩選120篇文章時，發現AI與專家之間有顯著一致性，顯示出AI在篩選中的潛力。這個框架能提高篩選效率，減少成本，並為AI在環境研究中的應用提供新方向。 PubMed DOI

Evaluating the performance of artificial intelligence in summarizing pre-coded text to support evidence synthesis: a comparison between chatbots and humans.
人工智慧在摘要預先編碼文本以支援實證綜合之表現評估：聊天機器人與人類的比較 BMC Med Res Methodol 2025-05-30

這項研究發現，AI聊天機器人在醫療互動相關回顧的表現和人類一樣準確，內容更完整、脈絡解釋也更好，但回答較長。人類則較少加入新內容。ZenoChat表現最佳，顯示大型語言模型能有效協助質性研究，加快整理證據的速度。 PubMed DOI

Automating updates for scoping reviews on the environmental drivers of human and animal diseases: a comparative analysis of AI methods.
自動化更新關於人類與動物疾病環境驅動因素的範疇性回顧：AI方法的比較分析 Front Artif Intell 2025-06-25

這篇論文探討用AI，特別是大型語言模型，來自動化整理動物傳染病環境風險因子的文獻回顧。研究比較不同AI方法，目的是提升找出相關風險因子的效率和準確度，解決病原體快速變異、文獻需常更新的問題。 PubMed DOI

原始文章

站上相關主題文章列表