Transforming literature screening: The emerging role of large language models in systematic reviews.
文獻篩選的轉變：大型語言模型在系統評價中的新興角色。 Proc Natl Acad Sci U S A 2025-01-06

系統性回顧（SR）在綜合醫學文獻中非常重要，但手動篩選文章耗時。大型語言模型（LLMs）有潛力協助篩選相關文獻，雖然目前效果仍在研究中。本研究比較了18種LLMs與人類審稿者在三個SR中的選擇重疊情況。結果顯示，LLMs雖然識別的文章數量較少，但仍能正確分類相當多的標題和摘要。LLMs的表現受納入標準和回顧設計影響，能減輕人類審稿者的工作量，範圍從33%到93%不等。為了提升效果，需在使用前精煉標準。 PubMed DOI

Can large language models fully automate or partially assist paper selection in systematic reviews?
大型語言模型能否完全自動化或部分協助系統性回顧中的文獻選擇？ Br J Ophthalmol 2025-01-15

大型語言模型（LLMs）在學術研究中有助於提升效率，特別是在系統性回顧方面。本研究比較了兩種基於LLM的系統性回顧方法：完全自動化（LLM-FA）和半自動化（LLM-SA）。結果顯示，LLM-FA的效果有限，僅識別出32.7%至6.1%的相關論文；而LLM-SA則表現更佳，成功納入82.7%的相關論文，並有效排除92.2%的不相關論文。這顯示LLMs雖無法獨立完成任務，但可作為提升論文選擇效率的輔助工具。 PubMed DOI

Large language models for conducting systematic reviews: on the rise, but not yet ready for use - a scoping review.
大型語言模型在進行系統性回顧中的應用：雖然正在興起，但尚未準備好使用 - 一項範疇回顧。 J Clin Epidemiol 2025-02-28

機器學習，特別是大型語言模型（LLMs），越來越受到重視，能協助健康研究中的系統性回顧（SR）。研究團隊在多個資料庫中搜尋，自2021年4月以來共找到8,054個結果，並手動補充33篇，最終納入37篇專注於LLM應用的文章。分析顯示，LLMs在SR的13個步驟中使用了10個，最常見的應用為文獻搜尋、研究選擇和數據提取。雖然LLMs顯示潛力，但許多應用尚未經過驗證，顯示出這一領域的研究需求日益增加。 PubMed DOI

High-performance automated abstract screening with large language model ensembles.
高效能自動化摘要篩選與大型語言模型集成。 J Am Med Inform Assoc 2025-03-22

這項研究探討大型語言模型（LLMs）在系統性回顧中自動化摘要篩選的可行性。研究測試了六種LLMs，並在23篇Cochrane Library的系統性回顧中評估其分類準確性。初步結果顯示，LLMs在小型數據集上表現優於人類研究者，但在大型數據集上，由於類別不平衡，精確度下降。研究還發現，LLM與人類的結合能減少工作量並保持高敏感性，顯示自動化篩選可減輕研究者負擔。總體而言，LLMs有潛力提升系統性回顧的效率與質量，但仍需進一步驗證。 PubMed DOI

Natural Language Processing for Digital Health in the Era of Large Language Models.
大型語言模型時代的數位健康自然語言處理。 Yearb Med Inform 2025-04-08

大型語言模型（LLMs）對醫療領域的自然語言處理（NLP）影響深遠，近期的研究顯示，專為醫療文本設計的LLMs逐漸受到重視。這篇回顧分析了基於LLMs的生物醫學NLP，資料來源涵蓋多個學術平台，重點在醫學文獻、電子健康紀錄（EHRs）及社交媒體。雖然通用LLMs如GPT-4被廣泛使用，但針對特定應用的自訂LLMs趨勢上升。傳統模型在某些任務上仍優於新型LLMs，但後者在少量學習和生成任務中表現佳。未來研究需關注評估、偏見及公平性等議題。 PubMed DOI

Large Language Models for Global Health Clinics: Opportunities and Challenges.
全球健康診所的大型語言模型：機遇與挑戰。 J Am Coll Radiol 2025-04-09

大型語言模型（LLMs）在人工智慧領域是一大突破，能改變醫療溝通、研究和決策。它們能快速分享健康資訊，打破語言障礙，但整合進醫療系統時也面臨挑戰，如數據偏見、隱私問題及數位素養差異。儘管如此，LLMs的分析能力可支持基於證據的醫療政策。為了發揮其潛力，需制定倫理指導方針、減少偏見策略，並確保全球醫療資源的公平獲取。妥善解決這些挑戰，LLMs有望改善全球健康結果，促進健康公平。 PubMed DOI

Unveiling the Potential of Large Language Models in Transforming Chronic Disease Management: Mixed Methods Systematic Review.
揭示大型語言模型在轉變慢性疾病管理中的潛力：混合方法系統性回顧 J Med Internet Res 2025-04-16

慢性病是全球主要死因，LLMs（像ChatGPT）在管理慢性病上有潛力，能提供準確、易懂的健康建議，幫助病人自我管理和獲得支持。專業型LLMs表現更好，但目前證據有限，還有隱私、語言和診斷等挑戰。臨床應用還在初期，未來需加強資料安全、專業化和與穿戴裝置整合。 PubMed DOI

Utilizing Large language models to select literature for meta-analysis shows workload reduction while maintaining a similar recall level as manual curation.
利用大型語言模型選取進行統合分析的文獻，可在維持與人工篩選相似召回率的同時減少工作負擔。 BMC Med Res Methodol 2025-04-28

這項研究開發了 LARS-GPT 流程，利用多個大型語言模型協助系統性回顧和統合分析時的文獻篩選。實驗結果顯示，LARS-GPT 能在召回率超過 0.9 的情況下，減少超過 40% 的篩選工作量，證明 LLMs 能有效提升文獻篩選效率。 PubMed DOI

The emergence of large language models as tools in literature reviews: a large language model-assisted systematic review.
大型語言模型作為文獻回顧工具的興起：大型語言模型輔助的系統性回顧 J Am Med Inform Assoc 2025-05-07

這篇研究回顧了LLM在自動化科學文獻回顧的應用，分析了172篇論文。多數專案用ChatGPT或GPT系列，特別在文獻搜尋和資料擷取上表現比BERT好。不過，實際上很少有論文註明用LLM協助。雖然LLM處理數值資料還有些限制，但未來很可能會大幅改變文獻回顧的流程。 PubMed DOI

Enhancing Patient-Trial Matching With Large Language Models: A Scoping Review of Emerging Applications and Approaches.
利用大型語言模型提升病患與臨床試驗配對：新興應用與方法的範疇性回顧 JCO Clin Cancer Inform 2025-06-09

這篇文獻回顧指出，大型語言模型（LLMs）已被用來提升病患與臨床試驗配對的效率，尤其是OpenAI的模型。雖然LLMs能大幅提升配對準確度與規模，但目前仍面臨可靠性、可解釋性及過度依賴合成資料等問題。未來應加強模型調校、採用真實世界資料，並提升可解釋性，才能真正發揮其潛力。 PubMed DOI

原始文章

站上相關主題文章列表