原始文章

生活證據綜合(LES)是一種定期更新系統性回顧的方法,雖然有工具能自動搜尋文章,但數據提取仍需手動進行。本文介紹了一個使用Python和ChatGPT的概念驗證程式,能自動化從期刊文章中提取數據,顯著縮短時間並保持準確性。我們在估算COVID-19潛伏期的研究中測試了此程式,並討論了其限制,如信息量及AI處理速度。這項研究為AI在科學研究中的應用提供了新視角,探討了提升數據處理效率的潛力。 PubMed DOI


站上相關主題文章列表

這項研究探討使用一個大型語言模型(GPT-4)來自動化系統性文獻回顧和網絡荟萃分析中的數據提取、程式碼生成和結果解釋。該模型在提取數據和生成腳本方面表現出高準確性,有潛力節省時間並減少錯誤。雖然需要定期進行技術檢查,但未來大型語言模型的改進可能進一步增強自動化效果。 PubMed DOI

在醫學研究中,系統性回顧至關重要但耗時費力。ChatGPT-4和自動化改變了這情況,加快了過程並提高了可靠性。ChatGPT-4是智能助手,可快速評估研究中的偏見風險,改變了這領域,潛在挽救生命。雖需人類監督,但ChatGPT-4和自動化助力下,循證醫學前景光明。 PubMed DOI

系統性回顧和統合分析是循證醫學的重要步驟,對於制定指導方針至關重要。這些過程雖然能夠有效總結研究知識,但因為耗時且勞動密集,更新不易,可能會影響其相關性。為了解決這個問題,我們提出一個框架,利用大型語言模型和自然語言處理技術,來提升系統性回顧的效率,特別是在診斷測試準確性方面。這個框架能自動化篩選階段,減少時間和資源的需求,同時保持回顧的質量,讓系統性回顧能更快回應新證據,提升臨床實用性。 PubMed DOI

這篇文章探討了ChatGPT在系統性回顧和統合分析中的應用、風險及建議。研究指出,ChatGPT在文獻篩選和資訊提取上表現不錯,但在偏見風險評估等複雜任務中則較弱,顯示人類專業知識的重要性。為了有效整合ChatGPT,需謹慎規劃和嚴格控管,並注意AI的錯誤現象。文章強調透明度和遵循倫理標準,建議研究者提升自我迭代、提示工程及批判性思維等技能,以增進AI的表現和人機合作的效率。 PubMed DOI

這項研究利用大型語言模型(LLMs),如GPT-4-turbo和Claude-3-Opus,開發自動化數據提取流程,針對持續系統性回顧(LSRs)。研究分析了10個臨床試驗的數據,專注於23個關鍵變數。結果顯示,在提示開發集中,96%的回應一致,準確率高達0.99;測試集中則為87%,準確率0.94。對於不一致的回應,GPT-4-turbo和Claude-3-Opus的準確率分別為0.41和0.50,經交叉評析後,51%的回應變得一致,準確率提升至0.76。研究顯示,LLMs能有效提取數據,並透過交叉評析提高準確性。 PubMed DOI

這項研究評估了ChatGPT-4o在系統性回顧中提取數據的效果,並與人類審稿人進行比較。研究聚焦於運動與跌倒風險降低的相關論文。結果顯示,ChatGPT-4o的數據提取準確率高達92.4%,錯誤率僅5.2%。其數據提取的重現性也很強,兩次獨立會議的協議率達94.1%,但若論文缺少資訊,這個比例會降到77.2%。總體來看,ChatGPT-4o是一個可靠的數據提取工具,未來在數據總結方面有潛力發展。 PubMed DOI

隨機對照試驗(RCTs)對循證醫學非常重要,但有些試驗使用虛構數據,影響研究的完整性。本研究探討利用GPT-4驅動的ChatGPT來簡化RCT評估過程。透過TRACT檢查表,ChatGPT能有效處理RCT論文的PDF,並準確回答檢查項目,與人類評估者的一致性達84%。此外,ChatGPT在數據提取方面也表現出色,對三個表格達到100%準確率。未來將致力於提升ChatGPT在多個RCT中的應用,實現更高的數據捕捉準確性及自動化處理。 PubMed DOI

這項研究探討如何利用大型語言模型(LLMs)自動化提取生活系統性回顧(LSRs)中的數據,模擬兩位審稿人的流程。分析了來自10個試驗的數據,針對23個變數進行研究。使用的模型包括GPT-4-turbo和Claude-3-Opus。結果顯示,在提示開發集中,模型達到96%的高一致性率,但在測試集中降至87%。經過交叉評析後,51%的不一致回應變得一致,整體準確率提升至0.76。研究表明,LLMs能有效支持數據提取,促進系統性回顧的進行。 PubMed DOI

這篇研究指出大型語言模型(LLMs)在提升證據綜合效率方面的潛力,特別是在隨機對照試驗(RCTs)的數據提取上。作者針對LLMs開發了結構化提示,使用Claude(Claude-2),涵蓋了Cochrane手冊的六大領域共58項內容。他們在10個已發表的Cochrane評論RCT上測試,結果顯示數據提取準確率高達94.77%,各領域準確率介於77.97%到100%之間,且每個RCT的提取時間僅需88秒。這些結果顯示結構化提示能有效增強LLMs在系統性回顧中的應用,對證據綜合方法學是一大進步。 PubMed DOI

這項研究評估了大型語言模型ChatGPT在系統性回顧和統合分析中的表現,特別是在脊髓刺激後情緒功能的數據上。結果顯示,ChatGPT在標題和摘要篩選的準確率為70.4%,而全文篩選的準確率為68.4%。在數據整合方面,ChatGPT的準確率達到100%。雖然在篩選任務中表現中等,但在數據整合上表現優異。研究指出,人工智慧能提升系統性回顧的效率,但仍需人類監督以確保研究質量。 PubMed DOI