原始文章

這項研究開發了MedScaleNER框架,旨在透過基於測量的護理改善病人結果,特別是在非結構化的中文醫學文獻中識別醫學量表相關實體。由於標註數據有限,命名實體識別(NER)面臨挑戰。該框架結合大型語言模型(LLMs)和提示策略,成功識別量表名稱及測量項目。初步實驗顯示,GLM-4-0520與MedScaleNER結合後,達到59.64%的宏觀F1分數,顯示出顯著的改進,並為未來的研究提供了寶貴的見解。 PubMed DOI


站上相關主題文章列表

研究指出,GPT-3.5和GPT-4處理臨床數據時,只需少量訓練數據即可提取有價值資訊。透過改進提示策略,可增進模型在臨床命名實體識別任務表現,減少大量標註數據需求。雖GPT模型在臨床應用有潛力,仍需進一步改進。研究結果凸顯了量身定制的提示框架重要性,以提高大型語言模型在臨床環境性能。 PubMed DOI

研究使用真實世界數據評估大型語言模型(LLMs)在標準化產科診斷術語時的表現,發現LLMs在無監督設置中表現較佳。不同的提示工程設置會影響LLMs的表現,其中QWEN提示效果最好,有助於提高診斷術語對齊效率。 PubMed DOI

LLMs在臨床應用上很強大,但缺乏標記數據。為了掌握臨床知識,需要進行上下文學習。研究評估了零-shot和少-shot臨床信息提取的提示工程技術。結果顯示,定制任務特定提示至關重要,而啟發式和集成提示也很有效。GPT-3.5表現最佳,並且集成方法有助於提升性能。這項研究為臨床自然語言處理的提示工程提供了重要的指導。 PubMed DOI

這項研究致力於開發一個針對傳統中醫的語言模型,旨在提升臨床推理能力,如診斷和處方建議。研究人員創建了三個重要數據集,並開發了Lingdan預訓練模型及兩個專門模型,分別用於症狀分析和草藥處方建議。這些模型在中醫知識回答和處方建議上表現優異,Lingdan-PR的F1-score比最佳基準提高了18.39%。這項研究顯示了人工智慧在改善醫療決策中的潛力,相關資料可在 https://github.com/TCMAI-BJTU/LingdanLLM 獲得。 PubMed DOI

這項研究聚焦於醫療領域的提示工程,探討其如何提升大型語言模型(LLMs)處理複雜醫療文本的能力。研究回顧了114篇2022至2024年間的相關文獻,發現提示設計(PD)是最常用的方法,且ChatGPT是最受歡迎的LLM。思考鏈技術被廣泛應用,但有61%的研究未報告基準,影響有效性評估。研究旨在提供醫療提示工程的現狀,識別機會與挑戰,並提出未來研究的指導方針。 PubMed DOI

命名實體識別(NER)模型在從非結構化醫療文本中提取結構化資訊方面非常重要,能識別疾病和治療等實體,對臨床決策和研究有幫助。近期基於BERT的深度學習進展提升了NER能力,但醫學術語的複雜性使得模型在不同數據集上的表現不一。本研究評估了七種NER模型在醫療文本分析中的表現,特別關注複雜術語和宏觀因素對準確性的影響。結果顯示,經微調的BERT在某些數據集上表現最佳,並強調了針對性優化的必要性,以增強臨床決策和開發更有效的醫療NER模型。 PubMed DOI

這項研究探討大型語言模型(LLMs)在中文生物醫學命名實體識別(BNER)任務的表現,這領域的研究相對較少。作者評估了多個LLMs,包括ChatGLM2-6B、GLM-130B、GPT-3.5和GPT-4,使用真實的中文電子病歷數據集及公共數據集。結果顯示,雖然LLMs在零樣本和少樣本情境下有潛力,但經過指令微調後表現顯著提升。特別是微調後的ChatGLM2-6B在真實數據集上超越了專門模型,而GPT-3.5在CCKS2017數據集上表現最佳,但仍未超過頂尖專業模型DGAN。這是首個評估LLMs在中文BNER任務的研究,顯示其潛力並為未來應用提供指導。 PubMed DOI

這項研究旨在開發和驗證一個框架,以評估大型語言模型(LLM)生成的急診室記錄的準確性和臨床適用性。研究中,52名參與者使用HyperCLOVA X LLM創建了33份記錄,並採用雙重評估方法進行分析。臨床評估顯示評估者之間的可靠性高,而定量評估則識別出七種主要錯誤類型,其中無效生成錯誤最為常見。研究結果顯示該框架在臨床可接受性上具備潛力,為未來的研究和應用提供了方向。 PubMed DOI

大型語言模型(LLMs)在醫學領域的應用越來越受到重視,但在中醫方面的研究仍然有限。本研究回顧了29項相關研究,發現LLMs在知識提取和輔助診斷方面有潛力。專為中醫設計的模型在執業醫師考試中達到70%的準確率,而通用模型則為60%。不過,LLMs在中醫應用上仍面臨數據質量、安全性及中醫特有的複雜性等挑戰。未來應著重於跨學科訓練和數據標準化等方向。 PubMed DOI

從自由文本醫療紀錄中提取結構化數據,特別是病理報告,面臨不少挑戰。傳統方法因醫療語言複雜而困難重重。這項研究開發了一個端到端的LLM管道,能有效提取病理報告中的診斷、解剖部位等元素。透過人機協作,我們將重大錯誤率降至0.99%。在3520份報告中,識別腎腫瘤亞型的F1分數達0.99,顯示LLM提取管道在良好指示下可達接近專家準確性,並可應用於其他臨床信息提取任務。 PubMed DOI