原始文章

這篇論文探討了一種利用大型語言模型來增強生物醫學關係提取的方法,特別是Gemini和GPT-4。研究中使用GPT-4生成增強的訓練數據,並將這些數據與不同模型的輸出結合,透過集成學習提升預測準確性。此外,Gemini的回應也用來微調BioNLP-PubMed-Bert分類模型。結果顯示,在BioCreative VIII Track 01挑戰的評估數據集上,精確度、召回率和F1分數都有所提升。想了解更多,可以透過提供的網址查詢。 PubMed DOI


站上相關主題文章列表

從生物醫學文獻中提取準確資訊相當複雜,因為這個領域跨學科且術語專業。早期的自然語言處理(NLP)方法常常無法掌握語言的細微差別,導致錯誤答案。隨著變壓器模型的出現,大型語言模型(LLMs)在問答任務中表現改善,但仍面臨挑戰,經常產生「幻覺」信息。我們的研究透過增強檢索架構來提升LLMs在生物醫學問答中的表現,並開發了問答機器人WeiseEule,強調用戶查詢信號的重要性,改善了回應的準確性和相關性。 PubMed DOI

這項研究比較了兩種大型語言模型(LLMs),Gemini 和 GPTs,在乳腺癌患者的 PET/CT 報告中提取數據和生成結構化報告的表現。研究涵蓋131名患者,發現 GPTs 在數據挖掘上準確率更高,特別是原發病灶(89.6% vs. 53.8%)和轉移病灶(96.3% vs. 89.6%)。此外,GPTs 在疾病進展決策和語義相似度上也優於 Gemini。整體來看,GPTs 在臨床應用中顯示出更高的潛力。研究使用多種統計方法驗證結果,數據可向通訊作者索取。 PubMed DOI

檢測蛋白質-蛋白質相互作用(PPIs)對於理解遺傳機制和疾病發展非常重要。隨著生物醫學文獻的增加,自動化提取這些相互作用的需求也愈加迫切。本研究評估了多種基於變壓器的模型在PPIs識別中的效果,發現BioBERT在多個數據集上表現最佳,達到91.95%的召回率。值得注意的是,雖然GPT-4並未專門針對生物醫學文本訓練,但其表現也相當出色,顯示出在生物醫學文獻挖掘上的潛力。相關代碼和數據集可在GitHub上獲得。 PubMed DOI

這項研究比較了兩個大型語言模型(LLMs),GPT-4 和 Gemini,在分析放射學報告以識別腫瘤問題的表現。研究涵蓋205名患者,結果顯示GPT-4在準確率、精確度、召回率和F1分數上均優於Gemini,特別是在腫瘤狀態的判斷上也更準確。這顯示出大型語言模型,尤其是GPT-4,在腫瘤監測方面的潛力。 PubMed DOI

這項研究比較了OpenAI的GPT-4和Google的Gemini Ultra在生成醫學研究引言的表現,特別是引用的準確性。結果顯示,Gemini在引用精確度上優於GPT-4,正確率分別為77.2%和54.0%。雖然GPT-4生成的引言較長,但包含更多未引用的信息。儘管Gemini表現較佳,兩者仍生成虛構證據,讓人對其學術可靠性產生疑慮。這強調了驗證AI生成內容的重要性,並建議進一步研究AI在科學寫作中的能力與限制。 PubMed DOI

實體與關係的聯合提取在資訊擷取中非常重要,尤其是在生物醫學文獻中。本文提出的模型有效解決了句內和句間的提取問題,對於長文本中的長距離依賴關係至關重要。模型結合了多種深度學習技術,如微調的BERT、圖卷積網絡、穩健學習及局部正則化條件隨機場,能準確識別生物醫學文本中的實體,並提取三元組關係。實驗結果顯示該模型在多個數據集上表現優異,促進了生物醫學知識圖譜的構建。相關代碼可在GitHub上獲取。 PubMed DOI

這項研究探討了一種基於提示的命名實體識別(NER)方法,使用Google的Gemini 1.5 Pro,專注於土耳其的乳房攝影報告,因為相關的自然語言處理工具較少。透過26,000個標記的提示和165個範例進行多次學習,模型在85份未標註報告上測試,成功提取五個臨床實體,結果顯示高準確率,放寬匹配的F1分數達0.99,精確匹配為0.84。這顯示大型語言模型在資源不足的語言中能有效自動化臨床信息提取,提升多語言醫療環境的工作流程與研究。 PubMed DOI

這篇論文探討生物醫學文本中的命名實體識別(NER)挑戰,特別是在數據稀缺的情況下。作者指出現有數據增強方法的不足,可能會影響語義,且忽略多尺度句子特徵。為了解決這些問題,他們提出利用ChatGPT生成多樣化的數據,並採用動態卷積捕捉多尺度語義,結合PubMedBERT增強特徵表示。實驗結果顯示,這種方法在四個生物醫學NER數據集上表現優於現有模型,顯示出在數據增強和模型泛化上的有效性。 PubMed DOI

這項研究發現,結合癲癇專業本體和分階段學習方法,可以大幅提升大型語言模型(如Gemini 1.0 Pro)從醫學文獻中準確擷取Dravet症候群藥物療效資料的能力。只需少量範例,模型就能達到百分之百準確率,有助於加速罕見疾病新藥開發。 PubMed DOI

這篇研究比較了 GPT-3.5、GPT-4 和 Google Gemini 等大型語言模型在生物醫學文本中擷取蛋白質-蛋白質交互作用的能力。結果顯示,Gemini 1.5 Pro 表現最好,F1 分數最高達 90.3%。雖然還不如專業模型,但只要設計好提示詞,這些工具對生物醫學研究人員來說就很容易上手。 PubMed DOI