原始文章

這項研究探討大型語言模型(LLMs)在生成重症監護病房(ICU)病人出院摘要的表現,分析了匿名臨床筆記。三個模型中,GPT-4 API的表現最佳,準確識別41.5%的關鍵臨床事件,ChatGPT和Llama 2則分別為19.2%和16.5%。雖然GPT-4在資訊組織和清晰度上表現優異,但仍有小錯誤,且所有模型在敘事連貫性和重要數據的捕捉上存在挑戰。總體來看,這些LLM在生成出院摘要上有潛力,但仍需改進。 PubMed DOI


站上相關主題文章列表

研究發現利用大型語言模型(LLMs)總結電子健康記錄(EHR)有助於減輕臨床文件負擔,提升臨床醫生專注於個性化患者護理。研究指出最佳適應的LLMs在完整性和正確性方面優於人工摘要,但也面臨挑戰,需要進一步改進。 PubMed DOI

研究發現GPT-4在醫學案例初步診斷、檢查和治療方面表現最佳,尤其在常見疾病方面。商業LLMs有潛力用於醫學問答,但仍需加強。開源LLMs則可應對數據隱私和培訓透明度需求。強調強大且受監管的AI模型在醫療保健領域的重要性。 PubMed DOI

研究發現,使用大型語言模型(LLM)轉換出院摘要為病人友善的語言,提升了易讀性。然而,除了可讀性外,還需注意準確性和安全性問題。在實際應用前,仍需醫師審查以確保資訊正確無誤。 PubMed DOI

研究比較了GPT-4和GPT-3.5-turbo在寫急診科出院摘要時的表現。結果顯示,雖然GPT-4通常寫得準確,但還是會出現錯誤,像是漏掉重要臨床資訊或加入幻覺。醫師了解這些錯誤很重要,可以檢查並修正內容,確保患者安全。 PubMed DOI

研究使用大型語言模型幫助病人提出問題,提升溝通效率。以范德堡大學醫學中心數據測試三個模型,CLAIR在清晰度、完整性和簡潔性表現最佳。GPT4在效用和完整性較高,但清晰度和簡潔性較差。CLAIR生成的問題與醫療者相符,有助改善溝通。 PubMed DOI

研究評估了大型語言模型在醫療保健領域的應用,尤其是在改善患者護理方面。使用MIMIC-III數據庫的電子健康記錄,測試了這些模型在識別特定疾病患者方面的效能。GPT-4在辨識COPD、CKD、PBC和Cancer Cachexia患者方面表現優異,而ChatGPT和LLaMA3則稍遜。儘管LLMs有潛力,但在臨床應用前仍需解決錯誤、解釋不足和倫理問題。進一步研究將有助於提升模型訓練和設計,以更好地應用於醫療保健。 PubMed DOI

這項研究評估了GPT-4在泌尿科門診生成出院信件的效果,並與初級醫師進行比較。出院信件對於護理連續性很重要,但撰寫過程常常耗時。研究中,GPT-4根據五個虛構的電子病歷撰寫信件,並由初級醫師用問卷評估其質量。結果顯示,GPT-4在資訊提供上表現優於初級醫師,且沒有產生虛假信息。雖然在清晰度和滿意度上無顯著差異,但GPT-4的信件質量與人類相當。整體而言,GPT-4可望提升醫療文檔的效率與一致性。 PubMed DOI

這項研究探討大型語言模型(LLMs)在臨床筆記段落識別的應用,旨在克服傳統監督方法的限制。研究將段落識別設為問答任務,並評估不同的LLMs,結果顯示GPT-4的F1分數最高,達到0.77,表現優異。最佳的開源模型Tulu2-70b得分為0.64,與GPT-3.5相當。研究指出,雖然微調模型在大數據集上表現穩定,但增加段落識別範例能提升性能。總體而言,LLMs,特別是GPT-4,已接近實際應用於臨床筆記段落識別,並可透過微調進一步改善。 PubMed DOI

這篇文章探討了人工智慧,特別是像ChatGPT這樣的大型語言模型在急診醫學和重症護理中的重要角色。它提到ChatGPT在診斷支持、臨床文檔和病人溝通等方面的應用,並指出其表現可與人類專業人士媲美。文章也強調了它在臨床決策和藥物選擇中的潛力,能提升病人護理品質。不過,將這些模型應用於醫療也帶來法律、倫理和隱私等問題,需持續研究和監管以確保其負責任的使用。 PubMed DOI

這項初步研究探討了大型語言模型(LLM),特別是LLaMA3,如何從三級醫院的出院摘要中提取中風審核數據。研究分析了一個月內的中風住院病人出院摘要,成功提取144個數據點,LLM的準確率高達93.8%(135個正確)。結果顯示,LLM能有效提升中風審核數據的收集效率,並建議進一步研究以優化LLM與醫療專業人員的合作。 PubMed DOI