原始文章

**重點整理:** 這篇研究比較了一個大型語言模型(LLaMA3.1)和一個基於BERT的模型,在德文醫療文本中的命名實體辨識(NER)表現,特別著重在訓練資料有限的情況下。兩個模型的表現相近,但在訓練資料較少時,LLaMA3.1的表現略優於BERT-based模型。 PubMed DOI


站上相關主題文章列表

這項研究針對將非結構化醫療文本轉換為結構化格式的挑戰,提出了一個自動化的本地流程,確保使用開源大型語言模型(LLMs)時能維護數據隱私。研究針對包含敏感健康資訊的德語醫療文件進行測試,結果顯示在800份非結構化醫療報告中,數據提取的準確率高達90%,表現優於醫生和醫學生的手動提取。這顯示該流程能有效提升數據可用性,同時保障隱私。 PubMed DOI

這項研究探討了如何在有限計算資源下,利用非專有的大型語言模型(LLMs)協助醫療專業人員撰寫德語醫療文本。研究團隊訓練了四個擁有70億參數的模型,並與商業模型Claude-v2進行比較。結果顯示,BLOOM-CLP-German模型在自動評估中表現最佳,且在專家評估中,有93.1%的生成報告被認為可用,僅需少量修改。這顯示即使資源有限,仍能生成適合臨床的醫療文檔,強調選擇非英語模型時需考慮目標語言的重要性。 PubMed DOI

您的研究顯示開源大型語言模型(LLMs)在醫療領域的潛力,特別是在德文臨床文本中提取心血管功能指標。透過分析497份心臟MRI報告,您成功提取14個指標,並達到95.4%的正確標註率和99.8%的命名實體識別準確率,顯示這些模型能有效處理醫療語言的複雜性。這項研究強調了開源LLMs在臨床環境中的應用潛力,並為未來在其他語言的醫療研究鋪路。 PubMed DOI

命名實體識別(NER)模型在從非結構化醫療文本中提取結構化資訊方面非常重要,能識別疾病和治療等實體,對臨床決策和研究有幫助。近期基於BERT的深度學習進展提升了NER能力,但醫學術語的複雜性使得模型在不同數據集上的表現不一。本研究評估了七種NER模型在醫療文本分析中的表現,特別關注複雜術語和宏觀因素對準確性的影響。結果顯示,經微調的BERT在某些數據集上表現最佳,並強調了針對性優化的必要性,以增強臨床決策和開發更有效的醫療NER模型。 PubMed DOI

這項研究探討大型語言模型(LLMs)在中文生物醫學命名實體識別(BNER)任務的表現,這領域的研究相對較少。作者評估了多個LLMs,包括ChatGLM2-6B、GLM-130B、GPT-3.5和GPT-4,使用真實的中文電子病歷數據集及公共數據集。結果顯示,雖然LLMs在零樣本和少樣本情境下有潛力,但經過指令微調後表現顯著提升。特別是微調後的ChatGLM2-6B在真實數據集上超越了專門模型,而GPT-3.5在CCKS2017數據集上表現最佳,但仍未超過頂尖專業模型DGAN。這是首個評估LLMs在中文BNER任務的研究,顯示其潛力並為未來應用提供指導。 PubMed DOI

這項研究探討了基於Transformer的預訓練大型語言模型(LLMs)在生物醫學領域的適應性與表現,特別針對自然語言推理(NLI)和命名實體識別(NER)兩個任務。研究旨在了解模型在這些任務上的表現與其捕捉資訊的能力之間的關係。分析了編碼器和解碼器基礎的LLMs的內部編碼及注意力機制,並比較了不同數據量微調前後的效果。結果顯示,模型的有效性與其內部機制中的特定模式有關,並提供了LLMs在生物醫學領域如何處理知識的見解。研究源代碼已在GitHub上公開。 PubMed DOI

這項研究評估了多種大型語言模型(LLMs)在從電子健康紀錄中提取數據的表現,使用了50份合成醫療筆記。共測試了18個LLM,並與基準模型RoBERTa比較,涵蓋多個任務。表現最佳的模型包括Claude 3.0 Opus、GPT 4等,準確率超過0.98,明顯優於RoBERTa的0.742。這些模型在多次測試中也展現出一致性,顯示出能有效協助數據提取,減輕醫療人員的負擔。不過,仍需用真實數據進一步驗證其實際應用效果。 PubMed DOI

這項研究用BERT語言模型結合框架語意學,能自動從德文乳房攝影報告中擷取並結構化資訊。經過醫院資料微調後,系統能準確辨識多種事實和實體,表現比Llama 3.3更好。這方法可客製化、保護隱私且易於解釋,有助推動放射科結構化報告。未來建議在不同資料集驗證其泛用性。 PubMed DOI

這項研究用開源大型語言模型(像LLaMA3)自動產生德文出院摘要,並請醫師評估品質。結果顯示,AI生成的摘要資訊算完整,但常漏掉重要細節或出現錯誤,尤其在複雜病例時更明顯。研究也發現資料集太小、資料不全和模型德文醫學詞彙不足是主要挑戰,建議未來要用更多資料和微調模型,才能提升表現。 PubMed DOI

這篇研究比較專有和開源大型語言模型在臨床文本中做 token-level 罕見疾病命名實體識別的表現。研究發現,雖然用了多種技術,LLMs 在這類任務上還是有不少困難,並針對醫療應用提出改進建議。 PubMed