原始文章

自然語言處理(NLP)在放射學等領域展現了將非結構化數據轉為結構化格式的潛力,但隱私問題使得數據集獲取困難。我們的目標是利用大型語言模型(LLMs)從救護人員與病人對話中提取醫療資訊,以填寫緊急應變程序表格。為此,我們開發了一個流程,使用"Zephyr-7b-beta"生成初步對話,再用GPT-4 Turbo進行精煉。初步結果顯示,"Zephyr-7b-beta"的準確率為94%,但經過精煉後略降至87%。這些結果顯示LLMs在醫療對話生成中的潛力與挑戰。 PubMed DOI


站上相關主題文章列表

研究評估了大型語言模型在醫療保健領域的應用,尤其是在改善患者護理方面。使用MIMIC-III數據庫的電子健康記錄,測試了這些模型在識別特定疾病患者方面的效能。GPT-4在辨識COPD、CKD、PBC和Cancer Cachexia患者方面表現優異,而ChatGPT和LLaMA3則稍遜。儘管LLMs有潛力,但在臨床應用前仍需解決錯誤、解釋不足和倫理問題。進一步研究將有助於提升模型訓練和設計,以更好地應用於醫療保健。 PubMed DOI

這項研究探討大型語言模型(LLMs)在生成重症監護病房(ICU)病人出院摘要的表現,分析了匿名臨床筆記。三個模型中,GPT-4 API的表現最佳,準確識別41.5%的關鍵臨床事件,ChatGPT和Llama 2則分別為19.2%和16.5%。雖然GPT-4在資訊組織和清晰度上表現優異,但仍有小錯誤,且所有模型在敘事連貫性和重要數據的捕捉上存在挑戰。總體來看,這些LLM在生成出院摘要上有潛力,但仍需改進。 PubMed DOI

這篇論文探討大型語言模型(LLMs)在電腦媒介臨床諮詢中的應用潛力,涉及醫生、電子健康紀錄(EHR)系統和病人。儘管自然語言處理(NLP)已有進展,但EHR中的自由文本數據尚未被充分利用。LLMs擅長理解和生成自然語言,能有效處理臨床對話。論文建議透過針對特定任務的預訓練和微調,醫療提供者可利用自由文本來識別病人安全問題、支持診斷,並改善臨床互動。作者認為,微調的LLMs結合提示工程,能提升初級護理諮詢的效率與效果。 PubMed DOI

這篇文章探討了人工智慧,特別是像ChatGPT這樣的大型語言模型在急診醫學和重症護理中的重要角色。它提到ChatGPT在診斷支持、臨床文檔和病人溝通等方面的應用,並指出其表現可與人類專業人士媲美。文章也強調了它在臨床決策和藥物選擇中的潛力,能提升病人護理品質。不過,將這些模型應用於醫療也帶來法律、倫理和隱私等問題,需持續研究和監管以確保其負責任的使用。 PubMed DOI

這項研究系統性回顧了生成性大型語言模型(LLMs)在臨床環境,特別是電子健康紀錄(EHRs)的應用。儘管自然語言處理技術進步,LLMs在臨床實踐中的整合仍有限,面臨多重挑戰。研究分析了自2023年以來的76篇相關文獻,發現包括提示工程的使用、少數多模態數據的應用、評估指標的多樣性,以及臨床決策中的偏見和幻覺等問題。未來需改進計算技術和標準化評估,以提升LLMs在醫療中的可靠性。總之,LLMs在病人護理上有潛力,但仍需克服重大障礙。 PubMed DOI

這篇論文探討大型語言模型(LLMs)的進展,特別是在醫療領域的應用,像是開發專注於臨床準確性的醫療聊天機器人和虛擬助手。文中介紹了一個新型的多輪對話模型,具備以下創新特點: 1. **層正規化調整**:改善訓練的穩定性。 2. **上下文滑動窗口回覆預測**:更好地捕捉對話上下文。 3. **局部關鍵信息提煉**:提升回覆質量。 該模型在MIMIC-III和n2c2數據集上測試,顯示出顯著的改進,能有效支持患者和醫療提供者。 PubMed DOI

這項研究評估了GPT-3.5-turbo和GPT-4-turbo在急診部門提供臨床建議的表現,分析了10,000次就診。結果顯示,這兩個模型的準確性都不如住院醫師,GPT-4-turbo平均低8%,而GPT-3.5-turbo低24%。雖然這些大型語言模型在敏感性上表現良好,但特異性較低,顯示出建議過於謹慎。研究指出,儘管LLMs在臨床應用上有潛力,但在成為可靠的醫療決策支持系統前,仍需大幅改進。 PubMed DOI

隨著醫療保健對先進分析的需求增加,合成健康數據的使用變得愈加重要,尤其是在獲取真實健康數據的挑戰下。大型語言模型(LLMs)的進展為生成合成健康數據提供了新機會,但也帶來潛在風險。本文綜述了合成健康數據生成(SHDG)及LLM的研究,探討生成對抗網絡等機器學習模型的現狀與局限性。SHDG面臨的挑戰包括評估指標、數據效率、健康公平等,雖然LLMs在某些方面顯示潛力,但深入研究其優缺點仍然至關重要。 PubMed DOI

這項研究探討增強檢索生成(RAG)的大型語言模型(LLMs)在急診科臨床紀錄中生成ICD-10-CM代碼的有效性,並與醫療提供者進行比較。研究基於Mount Sinai Health System的500次急診就診數據,發現RAG增強的LLMs在準確性和特異性上均優於醫療提供者,且GPT-4的表現尤為突出。即使是較小的模型如Llama-3.1-70B,經過RAG後也顯示出顯著提升。這顯示生成式人工智慧在改善醫療編碼準確性及減少行政負擔方面的潛力。 PubMed DOI

最近的研究顯示大型語言模型(LLMs)在自然語言處理,特別是遠程醫療中有很大潛力。研究比較了GPT-3.5、GPT-4和LLaMA 2在醫療諮詢摘要的表現。結果顯示,LLaMA2-7B在n-gram精確度上表現最佳,而GPT-4在語義準確性和可讀性上優於其他模型。所有模型在總結能力上相似,但GPT-4在內容理解和結構上稍有優勢,顯示其生成病人友好摘要的潛力。研究也探討了使用LLMs的潛在風險與限制。 PubMed DOI