原始文章

這篇研究推出輕量級生醫多模態小型語言模型 SigPhi-Med,僅用4.2B參數就能在多項醫學視覺問答測試中超越更大型模型。團隊針對模型大小、影像編碼器和訓練策略等進行優化,證明高效又省資源的醫療AI助理是可行的,對臨床應用很有幫助。原始碼已開放於 GitHub。 PubMed DOI


站上相關主題文章列表

準確的診斷對醫療保健至關重要,因為它是適時治療的基礎。雖然大型語言模型(LLMs)在學習上表現出色,但在臨床診斷的有效性仍需驗證。我們推出了MedFound,這是一個擁有1760億參數的醫療語言模型,經過大量醫療文本和臨床記錄的預訓練。透過自我引導和思維鏈方法,我們提升了其診斷推理能力。實驗結果顯示,MedFound在多種情境下表現優於其他模型,並能有效輔助醫生進行疾病診斷。 PubMed DOI

大型語言模型(LLMs)對醫療保健,特別是醫學影像領域,將帶來重大影響。隨著它們發展成能處理文本與影像的多模態模型(LMMs),醫生了解這些技術的基本概念變得相當重要,以便能有效且負責任地使用。文章介紹了標記嵌入、變壓器網絡、自我監督預訓練和微調等基本原則,並深入探討LMMs的技術創建過程及其在醫學影像中的應用。 PubMed DOI

這項研究介紹了 MedS-Bench,旨在評估大型語言模型(LLMs)在臨床環境中的表現,涵蓋11個關鍵臨床任務。我們評估了九個知名的 LLM,發現它們在面對這些任務時表現不佳。為了解決這些問題,我們創建了 MedS-Ins,這是一個針對醫療應用的大規模指令調整數據集,包含58個醫療語料庫和500萬個實例。透過實驗,我們展示了該數據集的有效性,並開發出改進的模型 MMedIns-Llama 3。我們已公開 MedS-Ins,並鼓勵研究社群參與進一步發展。 PubMed DOI

BioMedGPT是一個新型的多模態大型語言模型,專為生物醫學研究設計,克服了現有模型的限制。它透過廣泛的生物醫學文獻進行預訓練,增強知識基礎,並整合2D分子圖、蛋白質序列與自然語言。實驗結果顯示,BioMedGPT在理解生物醫學文件及回答研究問題上,表現與人類專家相當,並在分子和蛋白質問答任務中顯著提升ROUGE-L分數。相關資源已在GitHub上公開,供大家使用。 PubMed DOI

DeepSeek-V3 和 DeepSeek-R1 這類開源大型語言模型,在臨床決策支援上表現不輸甚至超越 GPT-4o、Gemini-2.0 等專有模型。最大優勢是能在本地安全微調,符合醫療隱私規範,非常適合台灣醫療現場應用。 PubMed DOI

這項研究用三種開源AI模型自動摘要病人影像檢查紀錄,經專業醫師評估,發現AI摘要內容準確、實用又好上手。這樣能幫醫師快速掌握重點,省下查閱時間,資訊品質也沒打折,對放射科工作流程很有幫助。 PubMed DOI

大型語言模型正快速改變醫療現場,不只協助診斷、提升衛教,也讓臨床流程更有效率。導入時要重視好用的介面、醫師訓練、AI與醫護合作,並落實隱私與倫理規範。未來會朝多模態、強化安全及結合機器人發展,但最重要的還是以病患安全和人本設計為核心,輔助醫療專業而非取代。 PubMed DOI

這項研究推出 Meerkat 小型醫療語言模型(7B 和 8B 參數),透過醫學教科書的高品質思路鏈資料和多元指令訓練,強化多步推理能力。Meerkat 在醫學考試和病例挑戰中表現優於其他小型模型,甚至超越人類平均分數,推理品質也獲專家肯定,同時兼顧輕量化和隱私。 PubMed DOI

大型語言模型在醫療文件撰寫和決策輔助上很有潛力,但因準確性、驗證、偏見和隱私等問題,現階段還不適合完全自動化臨床應用。未來要安全有效導入,需加強研究、訂定明確規範,並維持人工監督。 PubMed DOI

這篇研究提出 MedBLIP,結合影像編碼器和大型語言模型,有效提升胸腔X光醫學問答表現。透過多層影像特徵擷取和部分解凍模型權重,能更好整合影像與文字資訊。實驗證明,解凍31.25%權重可顯著提升準確率。雖無法取代醫師,但能輔助診斷與研究。程式碼已開源。 PubMed DOI