原始文章

研究團隊開發了一套經微調的大型語言模型,能自動從電子病歷的臨床紀錄中擷取阿茲海默症及相關失智症的7大症狀,準確度(AUROC)高達0.97-0.99,優於傳統方法。這些症狀不僅能預測失智症診斷,還和腦部MRI結果有關,有助提升診斷準確率並推動相關研究。 PubMed DOI


站上相關主題文章列表

這項研究探討大型語言模型(LLMs),特別是Llama 2和GPT-4,在電子健康紀錄中檢測認知衰退的有效性。研究在麻省總醫院進行,分析輕度認知障礙患者的臨床筆記,並將LLMs與傳統模型比較。結果顯示,GPT-4的表現優於Llama 2,但仍不及傳統模型。集成模型的表現最佳,達到90.2%的精確度。錯誤分析顯示模型間的錯誤特徵不同,建議結合LLMs與傳統模型以提升診斷效果。該研究獲得美國國家老齡化研究所及國家醫學圖書館的資助。 PubMed DOI

癡呆症的診斷在全球醫療中面臨挑戰,主要因為其複雜性及電子健康紀錄的不一致性。傳統診斷方法可能會漏掉或錯誤識別病例,因此需要改進工具。本研究探討人工智慧(AI)及大型語言模型(LLMs)在提升癡呆症檢測的潛力。研究結果顯示,使用GPT-4的患者紀錄聚合方法達到最高準確率0.86,顯示大型語言模型能顯著改善癡呆症診斷的準確性,優於傳統方法。 PubMed DOI

阿茲海默症是一種漸進性的神經系統疾病,影響全球數百萬人,導致認知能力下降和記憶喪失。傳統診斷方法難以早期檢測。本研究提出一種新方法,結合自然語言處理和大型語言模型,利用GenBERT來識別阿茲海默症的生物標記。透過整合臨床數據,GenBERT在早期預測方面表現優異,準確率達98.30%,並顯示出高敏感性和特異性,為阿茲海默症的早期診斷提供了可靠工具,可能改變未來的檢測與治療策略。 PubMed DOI

機器學習(ML)和人工智慧(AI)在醫療領域的應用潛力巨大,但仍面臨解釋性和可靠性等挑戰。本文提出一種新方法,利用大型語言模型(LLMs)進行特徵工程,從《牛津醫學教科書》中提取臨床特徵,提升可解釋性。這種方法將臨床筆記轉換為概念向量,並使用線性分類器,準確率達到0.72,超越傳統基準。使用文本嵌入技術也顯著降低了時間和成本,減少了97%。相關代碼和補充材料可在指定網址獲得。 PubMed DOI

目前用醫療理賠資料來判斷阿茲海默症和相關失智症,其實準確度不太理想。這篇研究用AI文字分類模型(像深度學習和大型語言模型)來分析電子病歷,結果發現Llama 2這種LLM模型表現最好,準確度明顯贏過傳統方法(AUC 0.95比0.85)。其他AI模型也比傳統方法優。這顯示用AI分析病歷有助於更準確找出ADRD病人,但還需要更多資料驗證。 PubMed DOI

這項研究用大型語言模型自動從電子病歷抓出智力及發展障礙、腦性麻痺患者的語言和行走能力,準確率很高(行走能力F1值超過0.9)。這方法能減少人工評估負擔、省成本,且適用不同醫院和紀錄格式。不過,還需要更多研究才能擴展到其他族群和更細的功能指標。 PubMed DOI

這項研究開發的 CD-Tron 臨床語言模型,能在 MCI 診斷前,從超過 2,000 名病患的電子病歷中,早期偵測認知衰退。CD-Tron 表現比傳統模型更好,準確率和敏感度都很高,還能用 SHAP 值解釋預測結果,提升臨床透明度,展現語言模型在醫療早期偵測的潛力。 PubMed DOI

**重點整理:** 這項研究顯示,只要搭配詳細的提示、範例和逐步推理,大型語言模型(LLMs)就能夠準確地從臨床紀錄中擷取出常見的病人症狀。跟傳統的機器學習方法相比,LLMs在從自由文本中辨識和標準化症狀資訊方面表現得更好,這有助於提升醫療流程,也能支持更多相關研究。 PubMed

這篇研究比較GPT-4大型語言模型、深度學習和機器學習三種方法在電子病歷症狀標準化上的表現。結果發現,GPT-4表現最好,顯示大型語言模型很有潛力成為未來醫師筆記自動化分析的主流工具,有助於推動精準醫療發展。 PubMed

這項研究用大型語言模型(LLMs)自動從電子病歷的臨床紀錄辨識失眠,準確度高於傳統BERT模型(F1分數93.0和85.7)。這個方法不只偵測失眠效果好,也有潛力應用在其他容易被忽略的疾病診斷上。 PubMed DOI