原始文章

Blue5模型透過多任務學習(MTL)和實例選擇(IS)來解決生物醫學自然語言處理的計算挑戰。它基於SciFive框架,整合經過校準的支持向量機(SVM)分類器,提升效率與性能。該模型在BLUE基準測試中,平均數據減少26.6%,顯示其能有效選擇最具資訊性的實例,改善泛化能力。IS和MTL的結合不僅提升了性能,還讓先進的NLP技術在生物醫學研究和醫療應用中更具可擴展性與可及性。 PubMed DOI


站上相關主題文章列表

這項研究開發了一個名為RAMIE的框架,專門用來從臨床記錄中提取膳食補充劑的資訊,重點在四個任務:命名實體識別、關係提取、三元組提取和使用分類。RAMIE透過指令微調、多任務訓練和檢索增強生成來提升效率和性能。結果顯示,Llama2-13B模型在命名實體識別和關係提取上都有所提升,而Llama2-7B在三元組提取上表現更佳。整體而言,RAMIE在多任務資訊提取上顯示出顯著進展。 PubMed DOI

這項研究介紹了 MedS-Bench,旨在評估大型語言模型(LLMs)在臨床環境中的表現,涵蓋11個關鍵臨床任務。我們評估了九個知名的 LLM,發現它們在面對這些任務時表現不佳。為了解決這些問題,我們創建了 MedS-Ins,這是一個針對醫療應用的大規模指令調整數據集,包含58個醫療語料庫和500萬個實例。透過實驗,我們展示了該數據集的有效性,並開發出改進的模型 MMedIns-Llama 3。我們已公開 MedS-Ins,並鼓勵研究社群參與進一步發展。 PubMed DOI

這項研究介紹了MedAdapter,一種新方法,能讓大型語言模型(LLMs)在生物醫學領域適應,而不需微調整個模型。MedAdapter使用小型的BERT適配器來排名LLMs生成的候選解,提升測試時的適應性。實驗顯示,MedAdapter在四個生物醫學任務上,白盒和黑盒LLMs的性能分別提升了18.24%和10.96%。這種方法資源效率高,且保護數據隱私,適合現有方法的靈活選擇。 PubMed DOI

BioMedGPT是一個新型的多模態大型語言模型,專為生物醫學研究設計,克服了現有模型的限制。它透過廣泛的生物醫學文獻進行預訓練,增強知識基礎,並整合2D分子圖、蛋白質序列與自然語言。實驗結果顯示,BioMedGPT在理解生物醫學文件及回答研究問題上,表現與人類專家相當,並在分子和蛋白質問答任務中顯著提升ROUGE-L分數。相關資源已在GitHub上公開,供大家使用。 PubMed DOI

這項研究探討自然語言處理(NLP)在臨床決策中的應用,特別針對西班牙語的轉診優先級排序和專科分類。研究發現,臨床特定的預訓練語言模型表現最佳,轉診優先級排序的宏觀F1分數達88.85%,專科分類為53.79%。雖然繼續預訓練稍微提升性能,但相對於計算成本,這些提升不算明顯。大型語言模型的少量學習在數據稀缺時仍有用。研究為臨床NLP從業者提供實用建議,強調考量數據可用性和任務複雜性。 PubMed DOI

生物醫學文獻快速增長,讓手動整理知識變得困難,生物醫學自然語言處理(BioNLP)希望透過自動化來解決這些問題。儘管大型語言模型(LLMs)在多個領域展現潛力,但在BioNLP的有效性尚未確立。本研究系統評估了四個LLMs,包括GPT和LLaMA,並與傳統模型如BERT和BART比較。結果顯示,傳統微調方法在大多數任務中表現較佳,但GPT-4在推理任務中表現突出。開源LLMs仍需微調以提升性能,研究也指出LLM輸出中存在信息缺失和幻覺問題。 PubMed DOI

這項研究評估了生物醫學調整的大型語言模型(LLMs)在臨床任務中的表現,與通用模型相比。研究發現,生物醫學LLMs的表現通常不如通用模型,尤其在與醫學知識無關的任務上。雖然一些大型模型表現相似,但較小的生物醫學模型明顯落後。這挑戰了精細調整LLMs能自動提升表現的觀念,建議探索其他策略,如檢索增強生成,以更有效地整合LLMs進入臨床環境。 PubMed DOI

DeepSeek-V3 和 DeepSeek-R1 這類開源大型語言模型,在臨床決策支援上表現不輸甚至超越 GPT-4o、Gemini-2.0 等專有模型。最大優勢是能在本地安全微調,符合醫療隱私規範,非常適合台灣醫療現場應用。 PubMed DOI

作者針對大型語言模型在醫療自然語言理解表現不佳,提出統一提示格式、多元醫療指令微調資料集,並以BioMistral微調成BioMistral-NLU。該模型在零樣本下於多項醫療NLU基準測試勝過原始BioMistral及ChatGPT、GPT-4等,證明多元任務指令微調能有效提升泛化能力。 PubMed

我們開發了一套用大型語言模型(LLMs)自動分類腫瘤臨床試驗和文獻的系統,在多個資料集和任務上都表現優異,準確率超過94%、F1-score超過92%,回應有效性最高達99.88%。雖然還有提示敏感度和運算資源的挑戰,但未來LLMs有望成為醫學文獻分類的重要工具。 PubMed DOI