原始文章

這項研究探討從隨機對照試驗(RCT)中提取樣本大小的挑戰,目的是改善搜尋功能並自動化系統性回顧。研究人員標註了847篇高影響力醫學期刊的RCT,並訓練了一個命名實體識別(NER)模型來提取樣本大小。結果顯示,最佳模型能準確預測64.7%的樣本大小,而GPT-4o模型的預測準確率達90.8%。研究認為,訓練NER模型是可行的,而大型語言模型如GPT-4o也能達到類似效果,但成本較高。 PubMed DOI


站上相關主題文章列表

研究評估了OpenAI的GPT和GPT-4在比較人類審查員時,對臨床研究論文標題和摘要的辨識表現。結果顯示,這些模型在篩選超過24,000個標題和摘要時表現準確且敏感,並展現了推理能力並修正錯誤。這些人工智慧模型有潛力優化審查流程、節省時間,並提升臨床研究品質,而非取代研究人員。 PubMed DOI

研究測試了RECTIFIER新方法,結合語言模型和自然語言處理,提高臨床試驗受試者篩選效率。結果顯示RECTIFIER比手動篩選表現更好,尤其在心臟衰竭試驗中。這技術有潛力改善篩選流程,但需謹慎,確保最終由臨床醫師審查,以確保患者安全。 PubMed DOI

研究目標是開發NLP方法和資料集,辨識RCT出版物中的自我承認限制。團隊建立了限制類型資料模型,標記了200份RCT出版物,透過微調BERT模型識別限制句子。他們嘗試運用資料擴增技術處理小資料庫問題。最佳模型在辨識限制句和類型方面有顯著進展,這自動化方法有助提高研究透明度,支持臨床試驗文獻的證據綜合。 PubMed DOI

LLMs在臨床試驗文件生成上有潛力。輝瑞挑戰使用LLMs自動化臨床試驗文件,尤其是為CSRs創建安全表摘要。評估顯示性能差異,特別是在事實準確性和寫作風格方面。團隊多使用GPT模型,改進方向包括表格輸入、上下文添加和微調。挑戰結果顯示LLMs在自動化CSRs中表格摘要有潛力,強調需優化人類輸入和持續研究。 PubMed DOI

使用大型語言模型如GPT-3.5 Turbo和GPT-4可提升臨床試驗患者配對的效率和準確性。研究顯示GPT-4在患者記錄和AI技術中表現優異,有助於減少招募錯誤、減輕研究負擔、加速研究。然而,仍需進一步研究以驗證其在實際臨床數據中的效用。 PubMed DOI

這項研究探討了一種三層篩選方法,利用GPT-3.5和GPT-4來提升雙相情感障礙治療的系統性回顧中標題和摘要的篩選效率。篩選分為三個層次:研究設計、目標患者及介入措施。結果顯示,GPT-4在敏感性和特異性上表現良好,顯示其在系統性回顧中的應用潛力。未來研究可考慮將此方法擴展至其他領域,以評估其更廣泛的有效性。 PubMed DOI

這項研究評估大型語言模型(LLMs)在系統性回顧和統合分析中的摘要篩選效果。研究人員使用Python腳本,與多種LLMs互動,包括ChatGPT 3.5和4.0、Google PaLM 2等,並將其表現與人類專家的納入決策進行比較。結果顯示,ChatGPT v4.0的準確率超過90%,顯示其在摘要篩選上的潛力。雖然LLMs尚無法完全取代人類專家,但能顯著提升篩選效率,未來可能改變相關工作流程。 PubMed DOI

這項研究旨在提升隨機對照試驗(RCT)出版物的報告品質,透過開發文本分類模型來檢視對CONSORT檢查表的遵循情況。研究使用了標註37個CONSORT項目的語料庫,訓練了多種模型,包括微調的PubMedBERT和BioGPT。主要發現顯示,微調的PubMedBERT模型在句子層級的微F1分數達0.71,文章層級為0.90。數據增強的影響有限,且針對方法的模型表現較佳。整體而言,這些模型能有效支持期刊編輯,改善RCT出版物的遵循情況。 PubMed DOI

這項研究探討了利用生成式人工智慧(GenAI)自動提取PICO(人口、介入、比較、結果)元素的方法,對於系統文獻回顧(SLRs)非常重要。考量到歐盟健康技術評估法規的要求,研究評估了GenAI在此任務上的可行性和效率。 研究人員從PubMed檢索了682,667篇隨機對照試驗的摘要,使用OpenAI的GPT-4o進行處理,PICO元素提取在三小時內完成,平均每1,000篇摘要處理時間為200秒。驗證結果顯示,GPT-4o準確提取了98%的PICO元素,顯示GenAI能顯著提升SLRs的效率,幫助製藥開發者更好地應對健康技術評估。 PubMed DOI

臨床試驗的病人招募常常困難,但TrialGPT提供了解決方案。它的框架包含三個主要模組: 1. **TrialGPT-Retrieval**:能有效篩選和檢索試驗,回收率超過90%,只用不到6%的資料。 2. **TrialGPT-Matching**:評估病人符合性,準確率達87.3%,與專家相當,並提供清晰解釋。 3. **TrialGPT-Ranking**:生成的試驗分數與人類判斷一致,排名準確度超越競爭對手43.8%。 使用者研究顯示,TrialGPT能減少42.6%的篩選時間,顯示出在病人與試驗匹配上的進展。 PubMed DOI