原始文章

這篇論文探討了一種利用大型語言模型來增強生物醫學關係提取的方法,特別是Gemini和GPT-4。研究中使用GPT-4生成增強的訓練數據,並將這些數據與不同模型的輸出結合,透過集成學習提升預測準確性。此外,Gemini的回應也用來微調BioNLP-PubMed-Bert分類模型。結果顯示,在BioCreative VIII Track 01挑戰的評估數據集上,精確度、召回率和F1分數都有所提升。想了解更多,可以透過提供的網址查詢。 PubMed DOI


站上相關主題文章列表

研究指出,GPT-3.5和GPT-4處理臨床數據時,只需少量訓練數據即可提取有價值資訊。透過改進提示策略,可增進模型在臨床命名實體識別任務表現,減少大量標註數據需求。雖GPT模型在臨床應用有潛力,仍需進一步改進。研究結果凸顯了量身定制的提示框架重要性,以提高大型語言模型在臨床環境性能。 PubMed DOI

生物醫學資料庫增加快速,分析資料對生物學和醫學至關重要。現有工具常難以完整處理條目或像人類一樣修正錯誤。大型語言模型(LLMs)如ChatGPT提供了新的查詢資料庫方式,但在擴展規模時會有挑戰。ChIP-GPT是基於GPT模型Llama微調的,能高精確度從序列讀取存檔中提取元數據。它能處理打字錯誤和缺失標籤,適應各種資料庫和問題。 PubMed DOI

生物醫學文獻增加快速,需要自動識別生物醫學概念關係。LitCoin NLP挑戰評估這個潛力,提供語料庫。我們的自然語言處理系統採用集成學習和基於規則的方法,在命名實體識別和關係提取任務表現優異,勝過200多支隊伍。微調110億參數模型提升性能,並與OpenAI ChatGPT等大型語言模型進行測試,顯示在生物醫學任務中具有優勢。結果凸顯特定模型對生物醫學研究的重要性。 PubMed DOI

了解基因、疾病和藥物對藥物開發很重要。研究指出,基於BERT的模型在識別蛋白質-蛋白質相互作用(PPIs)方面表現最佳,BioBERT召回率和F1分數最高,PubMedBERT精確度最高。即使沒有生物醫學背景,GPT-4也表現優秀。這些結果顯示GPT模型在檢測PPIs上有應用價值,值得進一步研究微調以應用於生物醫學任務。 PubMed DOI

生物醫學研究中,提取關係對整理資料、藥物再利用和新發現很重要。研究者利用關係分類來改進SemMedDB,並透過PubMedBERT模型進行訓練。測試結果顯示準確度、召回率和F1分數皆有提升。SemMedDB應用於1.2萬個摘要後,資料量增加一倍,67%的新預測正確。這個模型展現了提升生物醫學文獻挖掘的潛力。詳細資訊請參考https://github.com/Michelle-Mings/SemRep_RelationClassification。 PubMed DOI

關係抽取是NLP中的一個任務,專注於提取生物醫學實體之間的語義關係。研究者們正在研究使用大型語言模型如GPT-3.5-turbo和GPT-4來進行這項任務。在研究中,這些模型在EU-ADR、GAD和ChemProt三個標準數據集上進行了測試,並取得了不錯的成績。在某些情況下,GPT模型的表現甚至可以與BioBERT和PubMedBERT相媲美。 PubMed DOI

從生物醫學文獻中提取準確資訊相當複雜,因為這個領域跨學科且術語專業。早期的自然語言處理(NLP)方法常常無法掌握語言的細微差別,導致錯誤答案。隨著變壓器模型的出現,大型語言模型(LLMs)在問答任務中表現改善,但仍面臨挑戰,經常產生「幻覺」信息。我們的研究透過增強檢索架構來提升LLMs在生物醫學問答中的表現,並開發了問答機器人WeiseEule,強調用戶查詢信號的重要性,改善了回應的準確性和相關性。 PubMed DOI

這項研究比較了兩種大型語言模型(LLMs),Gemini 和 GPTs,在乳腺癌患者的 PET/CT 報告中提取數據和生成結構化報告的表現。研究涵蓋131名患者,發現 GPTs 在數據挖掘上準確率更高,特別是原發病灶(89.6% vs. 53.8%)和轉移病灶(96.3% vs. 89.6%)。此外,GPTs 在疾病進展決策和語義相似度上也優於 Gemini。整體來看,GPTs 在臨床應用中顯示出更高的潛力。研究使用多種統計方法驗證結果,數據可向通訊作者索取。 PubMed DOI

檢測蛋白質-蛋白質相互作用(PPIs)對於理解遺傳機制和疾病發展非常重要。隨著生物醫學文獻的增加,自動化提取這些相互作用的需求也愈加迫切。本研究評估了多種基於變壓器的模型在PPIs識別中的效果,發現BioBERT在多個數據集上表現最佳,達到91.95%的召回率。值得注意的是,雖然GPT-4並未專門針對生物醫學文本訓練,但其表現也相當出色,顯示出在生物醫學文獻挖掘上的潛力。相關代碼和數據集可在GitHub上獲得。 PubMed DOI

命名實體識別(NER)模型在從非結構化醫療文本中提取結構化資訊方面非常重要,能識別疾病和治療等實體,對臨床決策和研究有幫助。近期基於BERT的深度學習進展提升了NER能力,但醫學術語的複雜性使得模型在不同數據集上的表現不一。本研究評估了七種NER模型在醫療文本分析中的表現,特別關注複雜術語和宏觀因素對準確性的影響。結果顯示,經微調的BERT在某些數據集上表現最佳,並強調了針對性優化的必要性,以增強臨床決策和開發更有效的醫療NER模型。 PubMed DOI