Evaluating GPT Models for Automated Literature Screening in Wastewater-Based Epidemiology.
評估 GPT 模型在污水基礎流行病學中自動文獻篩選的應用。 ACS Environ Au 2025-01-20

這項研究探討了利用AI模型，特別是GPT-3、GPT-3.5和GPT-4，自動化污水流行病學文獻篩選，以提升綜合分析的效率。結果顯示，GPT-4在識別原始數據論文方面表現優異，精確度達0.96，召回率為1.00，超越目前的人工篩選標準。不過，這些模型在準確識別相關取樣地點上仍有挑戰，顯示人類監督的重要性。研究強調模型設計的謹慎性，建議AI輔助篩選能提升WBE研究效率，但仍需人類介入以確保準確性。 PubMed DOI

Classification performance and reproducibility of GPT-4 omni for information extraction from veterinary electronic health records.
GPT-4 omni 在從獸醫電子健康紀錄中提取資訊的分類性能與重現性。 Front Vet Sci 2025-01-31

這項研究評估了兩個大型語言模型（LLMs），GPT-4 omni（GPT-4o）和GPT-3.5 Turbo，在從貓咪慢性腸病的獸醫電子健康紀錄中提取資訊的表現。結果顯示，GPT-4o的敏感度和特異性均高於GPT-3.5 Turbo，分別為96.9%和97.6%。此外，GPT-4o的重現性也優於人類配對，顯示其在自動化資訊提取方面的潛力。不過，仍需進一步驗證以確保其在實際應用中的準確性和可靠性。 PubMed DOI

Assessing the performance of generative artificial intelligence in retrieving information against manually curated genetic and genomic data.
評估生成式人工智慧在檢索手動策劃的遺傳和基因組數據方面的表現。 Database (Oxford) 2025-02-18

這篇論文探討大型語言模型（LLMs），特別是GPT-3.5和GPT-4，在數據提取和呈現的有效性，並與人類策展人比較。研究聚焦於小麥和大麥的遺傳特徵，使用36篇期刊文章的資料供GrainGenes數據庫使用。主要發現包括：GPT-4在分類手稿準確率達97%，有效提取80%特徵，並顯示人類與AI合作的潛力。儘管LLMs有其限制，但在生物數據提取上仍能提供顯著幫助，使用者需謹慎對待不準確性。 PubMed DOI

Information Extraction from Clinical Texts with Generative Pre-trained Transformer Models.
使用生成預訓練變壓器模型從臨床文本中提取信息。 Int J Med Sci 2025-03-03

本研究評估了GPT-3.5和GPT-4在從非結構化臨床文本中提取資訊的效果。使用了病人特徵、病史和臨床檢測結果的資料，並透過簡單提示進行查詢。結果顯示，GPT-4在性別資訊提取上準確率達95%，優於GPT-3.5的70%；但在身體質量指數（BMI）方面，GPT-3.5的78%表現更佳。研究建議整合特定任務的定義進入提示中，以提升提取效果，並鼓勵專業人士設計有效提示，監控大型語言模型的表現。 PubMed DOI

Novel AI applications in systematic review: GPT-4 assisted data extraction, analysis, review of bias.
系統性回顧中的新型 AI 應用：GPT-4 協助的數據提取、分析及偏見審查。 BMJ Evid Based Med 2025-04-08

這項研究評估了自訂的GPT-4模型在醫學文獻數據提取和評估方面的表現，以協助系統性回顧。研究團隊創建了四個專門模型，針對研究特徵、結果、偏見評估及風險評估進行分析。結果顯示，GPT-4在數據提取的符合率達88.6%，且在2.5%的情況下準確性超過人類評審。在偏見評估方面，GPT-4的內部一致性公平至中等，外部一致性則優於人類評審者。整體而言，GPT-4在系統性回顧中展現出潛在的應用價值。 PubMed DOI

Assessing the performance of generative artificial intelligence in retrieving information against manually curated genetic and genomic data.
生成式人工智慧在檢索手動整理的遺傳與基因體資料時的表現評估 Database (Oxford) 2025-04-22

這項研究發現，GPT-4在整理小麥和大麥相關科學論文的遺傳資料時，準確率高達97%，擷取性狀和標記-性狀關聯的表現也比GPT-3.5好，錯誤率更低。GPT-4有時甚至能達到人類專家的96%水準。雖然還有改進空間，但未來在協助整理科學資料上很有潛力。 PubMed DOI

Testing the utility of GPT for title and abstract screening in environmental systematic evidence synthesis.
在環境系統性證據綜合中測試 GPT 用於標題與摘要篩選的實用性 Environ Evid 2025-04-24

這篇論文發現，GPT-4在系統性文獻回顧時，能準確又有效地篩選相關文章標題和摘要。在近1.2萬筆資料測試下，GPT-4在特定門檻下可達100%召回率，人工篩選時間最多可省下75%。但還需更多主題和提示詞的研究，才能確認其穩定性。 PubMed DOI

PlantGPT: An Arabidopsis-Based Intelligent Agent that Answers Questions about Plant Functional Genomics.
PlantGPT：一個以阿拉伯芥為基礎、可回答植物功能基因體學問題的智慧型代理人 Adv Sci (Weinh) 2025-05-21

研究團隊開發了PlantGPT，專為植物基因研究設計的AI模型，能更精確回答植物基因功能問題，錯誤率也比一般AI低。PlantGPT就像植物基因專家，已經有線上工具可用，未來也有望成為作物研究AI的參考標準。 PubMed DOI

Structured Knowledge Base Enhances Effective Use of Large Language Models for Metadata Curation.
結構化知識庫提升大型語言模型於中繼資料編輯的有效應用 AMIA Annu Symp Proc 2025-05-26

這項研究發現，單靠GPT-4提升肺癌資料集的metadata品質效果有限，但如果有結構化的領域知識（如範本）輔助，GPT-4表現會大幅提升。代表只要有知識庫支援，LLM自動整理metadata會更有效率。 PubMed

Evaluating generative AI for qualitative data extraction in community-based fisheries management literature.
在社區型漁業管理文獻中評估生成式AI於質性資料萃取的應用 Environ Evid 2025-06-01

這項研究比較GPT-4 Turbo和Elicit兩款AI工具，從33篇社區型漁業管理論文中擷取質性資料的表現。結果發現，AI在抓取情境性資料時表現不一，但有時能和人工審查者一樣好。整體來說，AI可協助文獻回顧，但還是需要人工把關，顯示AI有潛力但目前仍有限制。 PubMed DOI

原始文章

站上相關主題文章列表