原始文章

生物調控事件的提取是生物醫學自然語言處理(BioNLP)中的重要研究領域。傳統方法面臨文本挖掘的錯誤連鎖問題及語料庫主題範圍有限的挑戰。大型語言模型(LLMs)因其強大的語義理解和廣泛知識,提供了潛在解決方案。在第八屆生物醫學聯合註釋黑客松(BLAH 8)中,我們探討了使用LLMs提取與水稻相關的生物調控事件。結果顯示LLMs表現良好,但也發現幾個需解決的問題,以便未來在低資源主題中應用。 PubMed DOI


站上相關主題文章列表

研究利用深度學習模型從生醫文獻中找出微生物與疾病的關係。研究者發現,調整模型並結合特定領域數據,顯著提升了效能,有些模型甚至達到最頂尖水準。這顯示預先訓練的語言模型在從科學文獻中擷取有用資訊方面有很大潛力,特別是在微生物組與疾病互動方面。 PubMed DOI

研究比較了21個大型語言模型(LLMs)在自動文本挖掘生物途徑的效能,專注於基因調控和KEGG途徑辨識。結果顯示,各模型表現不同,像是ChatGPT-4和Claude-Pro這類基於API的模型表現比開源模型好。LLMs在生物醫學研究中有潛力,可用於基因網絡分析和途徑對應,但因性能不同,選擇適合的模型至關重要。 PubMed DOI

這篇論文評估了大型語言模型(LLMs)在各種生物醫學任務上的表現,發現即使在較小的生物醫學數據集上沒有進行特定微調,LLMs 也能表現良好。雖然LLMs 在所有任務上可能不如專門的生物醫學模型表現優秀,但它們展現了在具有有限標註數據的生物醫學任務中作為有用工具的潛力。 PubMed DOI

生物醫學文獻增加快速,需要自動識別生物醫學概念關係。LitCoin NLP挑戰評估這個潛力,提供語料庫。我們的自然語言處理系統採用集成學習和基於規則的方法,在命名實體識別和關係提取任務表現優異,勝過200多支隊伍。微調110億參數模型提升性能,並與OpenAI ChatGPT等大型語言模型進行測試,顯示在生物醫學任務中具有優勢。結果凸顯特定模型對生物醫學研究的重要性。 PubMed DOI

深度學習,特別是大型語言模型(LLMs),在植物生物學中展現出很大的潛力,能為植物細胞系統提供新見解。蛋白質語言模型(PLMs)提升了我們分析核酸和蛋白質序列的能力,揭示生物數據中的複雜模式和關係。這不僅有助於識別序列模式和結構-功能關係,還能促進農業基因改良。透過整合深度學習,我們在植物性狀的基礎研究上能取得顯著進展。因此,戰略性地應用這些方法對推進植物科學和可持續農業至關重要。 PubMed DOI

這項研究探討小型大型語言模型(sLLM)在從病理報告中提取關鍵資訊的效果。使用三個版本的Llama 2模型,參數從70億到700億不等,並在零樣本和五樣本學習情境下進行評估。結果顯示,700億參數的模型在五樣本情境下表現優異,顯示sLLM能有效提升數據提取的效率與準確性。研究強調範例學習的重要性,並討論模型大小、準確性及處理時間的權衡,支持在臨床環境中應用先進語言模型,以改善病人護理和生物醫學研究。 PubMed DOI

這項研究評估大型語言模型(LLMs)在從科學文獻中提取生態數據的表現,並與人類審稿人進行比較。結果顯示,LLMs提取相關數據的速度超過50倍,對於離散和類別數據的準確率超過90%。不過,它們在某些定量數據的提取上仍有困難。雖然LLMs能顯著提升建立大型生態數據庫的效率,但仍需額外的質量保證措施來確保數據的完整性。 PubMed DOI

這項研究評估了21個大型語言模型(LLMs)在檢索生物知識的有效性,特別針對基因調控和KEGG途徑。隨著生物文獻的快速增長,傳統手動整理已不再足夠,LLMs成為一個有前景的替代方案。 結果顯示,模型性能差異明顯,GPT-4和Claude-Pro在基因調控關係的F1分數分別為0.4448和0.4386,KEGG途徑的Jaccard指數也表現強勁。相比之下,開源模型表現較差。研究強調選擇合適模型的重要性,並提供了LLMs在生物研究中的應用見解,相關代碼已在GitHub上公開。 PubMed DOI

這項研究全面探討大型語言模型(LLMs)在生物醫學與健康資訊學(BHI)的應用,強調其變革潛力及面臨的倫理與實際挑戰。透過分析1,698篇研究,發現LLMs在臨床決策支持、病患互動及醫療文件分析等領域的應用顯著增加,預期能提升診斷準確性。研究也揭示機構間的合作動態,特別是在心理健康和神經系統疾病的管理上,顯示出個人化醫療的潛力。儘管LLMs展現出巨大潛力,仍需重視倫理影響及模型驗證挑戰,以確保其在臨床上的有效性。 PubMed DOI

電子表型化是一個複雜的過程,涉及分析結構化和非結構化數據,使用規則技術、機器學習和自然語言處理。目前,準確的表型定義需要大量人力,主要依賴文獻回顧和專業知識,這使得擴展困難。大型語言模型(LLMs)提供自動提取表型定義的潛力,但也面臨可靠性和準確性等挑戰。我們的研究目標是建立標準評估集,確保模型輸出可靠,並測試不同提示策略以提取表型定義。結果顯示,雖然有進展,但仍需人類評估,且我們的方法有潛力減少文獻回顧所需時間。 PubMed DOI