Comparative analysis of generative LLMs for labeling entities in clinical notes.
臨床筆記中標註實體的生成式 LLMs 比較分析。 Genomics Inform 2025-02-06

這篇論文評估了不同微調的生成大型語言模型（LLMs）在臨床領域的零樣本命名實體識別（NER）表現。研究在第八屆生物醫學聯結註解黑客松進行，重點分析Llama 2和Mistral模型，並比較其基本版本與針對特定任務微調的版本。使用的數據集標註了疾病、症狀和醫療程序。結果顯示，經過指示微調的模型在實體識別上表現優於聊天微調和基本模型，且在要求簡單輸出結構時表現也有所提升。 PubMed DOI

PromptLink: Leveraging Large Language Models for Cross-Source Biomedical Concept Linking.
利用大型語言模型進行跨來源生物醫學概念連結。 Int ACM SIGIR Conf Res Dev Inf Retr 2025-02-28

這項研究介紹了PromptLink，一個新框架，用來連結不同數據來源的生物醫學概念，解決命名慣例不同的問題。傳統方法如字串匹配和機器學習有其限制，而PromptLink則利用大型語言模型（LLMs）生成候選概念，並透過兩階段提示過程進行連結。第一階段提取生物醫學知識，第二階段則精煉預測以提高可靠性。實證結果顯示，PromptLink能有效連結電子健康紀錄和生物醫學知識圖譜的概念，且不需額外的先驗知識或訓練數據，源代碼已在GitHub上公開。 PubMed DOI

Biomedical Text Normalization through Generative Modeling.
生物醫學文本標準化透過生成模型。 medRxiv 2025-03-17

這項研究探討了電子健康紀錄（EHRs）中非結構化醫療文本的標準化挑戰，因為這些文本格式不一致。約80%的EHR數據是非結構化的，作者使用大型語言模型（LLMs）來標準化這些文本，開發了四種策略，包括RAGnorm。研究評估了這些策略在三個SNOMED映射的病症術語數據集上的表現，結果顯示RAGnorm在所有數據集中的表現最佳，且在TAC2017任務中獲得88.01的微F1分數，顯示其在標準化生物醫學文本方面的潛力。 PubMed DOI

Enhancing data quality in medical concept normalization through large language models.
透過大型語言模型提升醫學概念標準化中的數據質量。 J Biomed Inform 2025-04-03

這項研究聚焦於醫療概念標準化（MCN），強調數據質量對其表現的重要性，並提出一個框架來提升數據質量，利用像ChatGPT這樣的大型語言模型。研究評估了MCN數據集的質量，並透過ChatGPT進行數據增強，分析生成數據的正確性。實驗探討數據質量對MCN模型的影響，並指出增強過程中的數據重複問題。最終，研究認為少樣本學習結合適當的上下文是提升MCN數據質量的有效方法，並提供了寶貴的見解。如需詳情，可參考提供的GitHub連結。 PubMed DOI

Benchmarking large language models for biomedical natural language processing applications and recommendations.
大型語言模型在生物醫學自然語言處理應用中的基準測試與建議。 Nat Commun 2025-04-05

生物醫學文獻快速增長，讓手動整理知識變得困難，生物醫學自然語言處理（BioNLP）希望透過自動化來解決這些問題。儘管大型語言模型（LLMs）在多個領域展現潛力，但在BioNLP的有效性尚未確立。本研究系統評估了四個LLMs，包括GPT和LLaMA，並與傳統模型如BERT和BART比較。結果顯示，傳統微調方法在大多數任務中表現較佳，但GPT-4在推理任務中表現突出。開源LLMs仍需微調以提升性能，研究也指出LLM輸出中存在信息缺失和幻覺問題。 PubMed DOI

Zero-shot learning for clinical phenotyping: Comparing LLMs and rule-based methods.
臨床表型判別的零樣本學習：比較大型語言模型（LLMs）與規則式方法 Comput Biol Med 2025-04-24

這項研究發現，GPT-4o 在不用人工標註的情況下，能準確又有效率地從電子病歷資料做慢性病分類，表現比傳統規則式方法和其他 LLMs 更好。GPT-4o 召回率高達 0.97，macro-F1 分數也有 0.92。若結合 LLMs 和規則式方法，還能進一步提升準確度，讓人工審查更聚焦在有疑慮的案例上。 PubMed DOI

Large language models for intelligent RDF knowledge graph construction: results from medical ontology mapping.
用於智慧型 RDF 知識圖譜建構的大型語言模型：醫學本體映射的研究結果 Front Artif Intell 2025-05-12

這篇論文提出用大型語言模型（像 GPT-4o）自動化醫療術語對應 SNOMED CT 等本體，建立 RDF 知識圖譜。研究比較六種系統，發現 GPT-4o 等現代 LLMs 在準確度和語意理解上都比傳統方法好很多，能大幅提升醫療知識圖譜的準確性和資料整合效率。 PubMed DOI

Biomedical text normalization through generative modeling.
透過生成式建模進行生物醫學文本正規化 J Biomed Inform 2025-05-17

這項研究比較了多種大型語言模型（LLM）方法，把電子病歷的非結構化醫療文本標準化成臨床術語。結果發現，檢索增強生成（RAGnorm）方法表現最穩定、準確度最高，即使沒訓練資料也很有效。這類檢索型LLM在生醫文本標準化上很有潛力，值得持續發展與應用。 PubMed DOI

Large Language Models Struggle in Token-Level Clinical Named Entity Recognition.
大型語言模型在臨床命名實體識別的詞元層級表現不佳 AMIA Annu Symp Proc 2025-05-26

這篇研究比較專有和開源大型語言模型在臨床文本中做 token-level 罕見疾病命名實體識別的表現。研究發現，雖然用了多種技術，LLMs 在這類任務上還是有不少困難，並針對醫療應用提出改進建議。 PubMed

Transfer Learning with Clinical Concept Embeddings from Large Language.
來自大型語言模型的臨床概念嵌入之遷移學習 AMIA Jt Summits Transl Sci Proc 2025-06-12

這項研究發現，像 Med-BERT 這種專為醫療設計的大型語言模型，比通用型模型更能處理不同醫院間的資料差異，提升知識轉移效果。通用模型如 OpenAI 需額外微調。未來建議持續研究如何在任務難度、資料量和微調之間取得最佳平衡。 PubMed

原始文章

站上相關主題文章列表