原始文章

數位化自然歷史標本的過程中,標籤轉換成數位數據常面臨挑戰。本研究探討了兩種提取資訊的方法:基於規則的方法和使用ChatGPT4的大型語言模型。研究比較了這兩者在達爾文核心欄位中的錯誤率。結果顯示,雖然ChatGPT4有時不符合標準,但基於規則的方法誤報率較高。研究人員因此開發了一種結合兩者的集成方法,顯著降低了錯誤率,提升了數據質量。儘管人為驗證仍然重要,自動化方法可加速標本館標籤的數位化,並適用於其他自然歷史收藏品。 PubMed DOI


站上相關主題文章列表

生物醫學資料庫增加快速,分析資料對生物學和醫學至關重要。現有工具常難以完整處理條目或像人類一樣修正錯誤。大型語言模型(LLMs)如ChatGPT提供了新的查詢資料庫方式,但在擴展規模時會有挑戰。ChIP-GPT是基於GPT模型Llama微調的,能高精確度從序列讀取存檔中提取元數據。它能處理打字錯誤和缺失標籤,適應各種資料庫和問題。 PubMed DOI

大型語言模型(LLMs)如ChatGPT被用來幫忙填表格等任務,尤其在整理癌症病歷時。一項研究使用ChatGPT 4.0從醫療報告中提取數據,顯示效率和成本效益皆有潛力。但仍需人類監督和整合現有工具以達最佳效果。生成式人工智能在處理腫瘤文檔上有潛力,但實際應用需謹慎評估人機互動。 PubMed DOI

研究發現ChatGPT在醫學註記中有潛力,能有效提取肺癌和小兒骨肉瘤報告的病理資訊,且不需大量標註。其高準確性顯示了將非結構化醫療數據轉換為結構化格式的潛力,有助於研究和臨床決策。 PubMed DOI

對於ChatGPT和Bard (Gemini)在檢索生物知識的評估顯示,這兩者在資料整理和研究上有明顯的限制。ChatGPT在24分中只得5分,而Bard得13分,顯示它們在提供準確和完整資訊方面面臨挑戰。常見問題包括缺乏細節、錯誤答案,以及準確與不準確資訊混雜。此外,這兩個模型還會虛構科學論文的參考文獻,讓人對其可靠性產生疑慮。因此,建議生物學家繼續依賴傳統的科學資訊來源,並偶爾重新評估這些AI工具的可靠性。 PubMed DOI

這項研究評估大型語言模型(LLMs)在從科學文獻中提取生態數據的表現,並與人類審稿人進行比較。結果顯示,LLMs提取相關數據的速度超過50倍,對於離散和類別數據的準確率超過90%。不過,它們在某些定量數據的提取上仍有困難。雖然LLMs能顯著提升建立大型生態數據庫的效率,但仍需額外的質量保證措施來確保數據的完整性。 PubMed DOI

這項研究探討了ChatGPT在科學文章審查中的有效性,並與傳統人類研究者的結果進行比較。研究人員對17篇有關醫療專業人員使用數位工具的文章進行系統性回顧,並透過特定提示引導ChatGPT分析。經過四次迭代後,ChatGPT的結果與原始回顧相當,但人類作者提供了更深入的分析和詮釋。雖然兩者在宏觀主題上相似,但人類驗證仍然重要,以確保研究的徹底性和深度。總體而言,ChatGPT在增強科學文獻產出方面展現潛力,但需依賴人類指導以達最佳效果。 PubMed DOI

這項研究評估了ChatGPT-4o在放射組學質量評分(RQS)方面的有效性,並與人類專家進行比較。研究納入了52篇2023至2024年發表的文章,結果顯示ChatGPT-4o和專家的中位RQS均為14.5,且無顯著差異。ChatGPT-4o的評分可靠性高,內部信度為0.905,且評估速度遠快於專家(每篇2.9-3.5分鐘對比13.9分鐘)。總結來說,ChatGPT-4o在放射組學研究質量評估上是有效且可靠的,未來可望成為快速自動化的評估工具。 PubMed DOI

這項研究評估了ChatGPT-4o在系統性回顧中提取數據的效果,並與人類審稿人進行比較。研究聚焦於運動與跌倒風險降低的相關論文。結果顯示,ChatGPT-4o的數據提取準確率高達92.4%,錯誤率僅5.2%。其數據提取的重現性也很強,兩次獨立會議的協議率達94.1%,但若論文缺少資訊,這個比例會降到77.2%。總體來看,ChatGPT-4o是一個可靠的數據提取工具,未來在數據總結方面有潛力發展。 PubMed DOI

這篇論文探討大型語言模型(LLMs),特別是GPT-3.5和GPT-4,在數據提取和呈現的有效性,並與人類策展人比較。研究聚焦於小麥和大麥的遺傳特徵,使用36篇期刊文章的資料供GrainGenes數據庫使用。主要發現包括:GPT-4在分類手稿準確率達97%,有效提取80%特徵,並顯示人類與AI合作的潛力。儘管LLMs有其限制,但在生物數據提取上仍能提供顯著幫助,使用者需謹慎對待不準確性。 PubMed DOI

這段文字探討了在對生物文本,特別是表型描述進行註釋時的挑戰,尤其是使用本體詞彙的情況。傳統文本挖掘工具在理解上下文方面表現不佳,而像OpenAI的GPT這類大型語言模型則更適合需要語義理解的任務。作者提出利用GPT對*Arabidopsis thaliana*和森林樹木的表型觀察進行本體詞彙註釋,目標是達到與人工註釋相當的效果。這些流程包括將表型解析為簡潔概念,並使用嵌入向量相似度和檢索增強生成(RAG)方法來識別合適的本體詞彙,最終實現高準確度的自動註釋。 PubMed DOI