原始文章

這篇論文探討了一種基於變壓器的西班牙臨床文本症狀命名實體識別(NER)方法,並使用SympTEMIST數據集進行多語言實體連結。作者微調了一個基於RoBERTa的標記級分類器,並結合了雙向長短期記憶和條件隨機場層,最終達到0.73的F1分數。實體連結方面,採用混合方法,結合字典和統一醫學語言系統的知識庫,並利用SapBERT生成候選實體,使用GPT-3.5進行重新排序,達到0.73的準確率,超越了之前的紀錄。數據庫可在此網址訪問:https://github.com/svassileva/symptemist-multilingual-linking。 PubMed DOI


站上相關主題文章列表

這個專案旨在開發一個處理自然語言的系統,目標是在2022年的n2c2挑戰中,提取藥物相關資訊和藥物變更的內容。團隊運用了先進的GatorTron變壓器模型,在大量臨床註釋上進行訓練,在藥物提取、事件分類和上下文分類等任務上表現優異。GatorTron模型優於其他變壓器模型,顯示了從臨床文本中提取藥物資訊的優勢。 PubMed DOI

研究使用大型語言模型如GPT和BERT自動記錄急診科臨床診斷,並進行BERT微調。透過XAI和SHAP方法分析模型,結果顯示KLUE-RoBERTa表現最佳,XAI提供可靠解釋。研究指出LLMs或許可簡化韓國急診科電子病歷記錄。 PubMed DOI

臨床文本和文件是重要的醫療資訊來源,利用先進的語言技術處理對於發展支援醫療保健和社會福祉的智慧系統至關重要。我們使用多語言神經網絡模型,如Transformer,以及大規模預先訓練的語言模型進行轉移學習,研究臨床文本機器翻譯。我們的研究顯示,小型預先訓練的語言模型在臨床領域微調中表現優於更大的模型,這是一個新的發現。這些結果對於醫療保健領域的機器翻譯發展具有重要意義。 PubMed DOI

大型語言模型在處理自然語言方面有很大潛力,特別是在文本生成、推理和少樣本學習方面表現優秀。然而,在生物醫學領域的命名實體識別方面,LLMs效果不如專門調校的模型好。為了解決這問題,開發了一種新的基於指令的學習方法,創建了BioNER-LLaMA。測試結果顯示,BioNER-LLaMA在生物醫學NER任務中表現優於GPT-4,與專門模型相當。這種方法有潛力提升LLMs在生物醫學和健康領域的競爭力,值得進一步研究。 PubMed DOI

這項研究使用了一個預先訓練的語言模型來檢測和提取臨床記錄中的癌症症狀,成功地在識別各種症狀方面達到了高準確度。這個模型的有效性突顯了對領域特定數據進行專門預訓練以增強醫學應用語言模型的潛力,特別是在改善癌症患者的症狀管理方面。 PubMed DOI

在醫學領域,差異診斷對準確治療很重要。傳統資源可能漏掉少見情況。這篇論文介紹兩種挖掘病因方法:一是NLP結合人類引導,另一是GPT-4生成模型。第二種方法精確但覆蓋範圍較窄。結合兩者可提高病因挖掘深度和可靠性。 PubMed DOI

這項研究針對生物醫學自然語言處理中的實體連結挑戰,特別是複雜的實體提及。作者提出了一種預處理方法,利用生成性大型語言模型進行文本簡化,從而生成更好的候選概念進行標準化。在BioCreative VIII SympTEMIST共享任務中,他們的方法回憶率提高了2.9個百分點,最終在測試集上達到63.6%的準確率。這項技術已整合進開源的xMEN工具包,並可在線獲得。 PubMed DOI

這項研究探討基於Transformer的命名實體識別(NER)模型,特別是標記級別與實體級別評估的差異。研究使用合成法語腫瘤報告數據集,對四個BERT模型進行微調,並評估其在兩個級別的表現。結果顯示,從標記級別轉向實體級別時,模型表現有明顯差異,強調了NER任務中評估方法的重要性。此外,雖然BERT模型表現不錯,但ChatGPT在識別法語複雜實體方面仍有挑戰。 PubMed DOI

這項研究專注於從非結構化的臨床筆記中提取與腫瘤學相關的結構化資訊,特別是癌症藥物與症狀負擔的關係。研究人員建立了名為CACER的資料集,包含超過48,000個醫療問題和藥物事件的詳細註解。經過微調的BERT和Llama3模型在事件提取上表現最佳,F1分數分別為88.2和88.0,而GPT-4在這些任務中的表現最差。這顯示微調模型在特定任務上更有效,CACER資料庫為未來的醫療資訊提取研究提供了重要資源。 PubMed DOI

這篇論文探討了基於變壓器的模型,旨在檢測社交媒體上用戶生成內容中的抑鬱症狀。研究強調了解釋性的重要性,特別是對健康專業人員而言。作者提出兩種方法:一是將分類和解釋任務分開,二是整合到同一模型中。他們還利用對話型大型語言模型(LLMs)進行上下文學習和微調,生成的自然語言解釋與症狀相符,讓臨床醫生更易理解模型輸出。評估結果顯示,能在提供可解釋的解釋的同時,達到高分類性能。 PubMed DOI