原始文章

透過結構化數據來識別免疫抑制患者相當困難,但像GPT-4o這樣的大型語言模型在從非結構化的臨床文本中提取結構化概念方面表現優異。我們的研究顯示,GPT-4o在分析住院紀錄時,能有效識別免疫抑制狀況和藥物使用,超越傳統方法。此外,這種技術也能成功應用於外部數據集。雖然GPT-4o mini和Llama 3.1等成本較低的模型也有不錯的表現,但仍無法與GPT-4o相比。 PubMed DOI


站上相關主題文章列表

使用大型語言模型如GPT-3.5 Turbo和GPT-4可提升臨床試驗患者配對的效率和準確性。研究顯示GPT-4在患者記錄和AI技術中表現優異,有助於減少招募錯誤、減輕研究負擔、加速研究。然而,仍需進一步研究以驗證其在實際臨床數據中的效用。 PubMed DOI

研究比較了GPT-4與傳統監督式模型在臨床註記中提取資訊的表現,結果顯示GPT-4在乳癌病理報告分類上表現優異,甚至超越其他LLMs和監督式模型。GPT-4的零-shot分類能力對標籤不平衡的任務特別有效。雖然LLMs減少了標註需求,但簡單模型配合大量標註資料也能達到相當效果。GPT-4有潛力加速臨床自然語言處理研究,減少標註需求,促進臨床研究中使用自然語言處理變數。 PubMed DOI

研究使用OpenAI的GPT-4模型分析非小細胞肺癌患者的電子健康記錄,結果顯示GPT-4在識別疾病階段、治療和進展方面比其他模型表現更好。這表示GPT-4在臨床表現型提取上比基於規則的模型更有效率,具有更高的精確度、召回率和F1分數。GPT模型在醫療領域有著重要的應用價值,因為它們提供了更好的上下文理解和臨床表現型識別能力。 PubMed DOI

研究評估了大型語言模型在醫療保健領域的應用,尤其是在改善患者護理方面。使用MIMIC-III數據庫的電子健康記錄,測試了這些模型在識別特定疾病患者方面的效能。GPT-4在辨識COPD、CKD、PBC和Cancer Cachexia患者方面表現優異,而ChatGPT和LLaMA3則稍遜。儘管LLMs有潛力,但在臨床應用前仍需解決錯誤、解釋不足和倫理問題。進一步研究將有助於提升模型訓練和設計,以更好地應用於醫療保健。 PubMed DOI

這項研究旨在提升從臨床筆記中提取與炎症性腸病(IBD)相關的病人報告結果(PROs),比較傳統自然語言處理(tNLP)和大型語言模型(LLMs)的效果。研究針對腹痛、腹瀉和糞便出血進行標註,並開發模型提取資訊。結果顯示,GPT-4在準確率上優於tNLP,尤其在外部驗證中表現穩定。研究強調LLMs在不同機構間的泛化能力,建議更廣泛應用這些工具以改善IBD的研究與病人護理。 PubMed DOI

這項研究探討大型語言模型(LLMs)在從非結構化放射報告中提取臨床數據的效果,專注於七種肺部疾病。研究分析了1,800份報告,並使用Google Gemini Pro 1.0、OpenAI的GPT-3.5和GPT-4進行數據提取。結果顯示,所有模型的準確率都很高,特別是GPT-4的表現最佳,敏感性和特異性均達到優秀水準。這些結果顯示,LLMs,尤其是GPT-4,可能成為醫生進行病歷審查的有效替代方案,提升非結構化放射數據的提取能力。 PubMed DOI

這項研究評估了大型語言模型(LLMs),特別是GPT-3.5和GPT-4,在從腫瘤科電子健康紀錄中提取患者共病情況的表現。研究分析了250份病歷報告,結果顯示GPT-4在敏感性上表現優於GPT-3.5和醫生,達到96.8%。雖然醫生在精確度上稍勝一籌,但GPT-4的表現更一致,且能推斷出非明確的共病情況。整體而言,這些模型在提取資訊方面顯示出潛力,可能成為數據挖掘的重要工具。 PubMed DOI

這項研究探討如何從電子健康紀錄中提取與炎症性腸病(IBD)相關的病人報告結果(PROs),比較了傳統自然語言處理(tNLP)和大型語言模型(LLMs)如GPT-4的表現。研究發現,GPT-4在提取腹痛、腹瀉和糞便血的準確率上均優於tNLP,特別是在外部驗證中保持高準確率。這顯示LLMs在IBD研究和病人護理中具有良好的應用潛力,且不受人口統計或診斷偏見影響。 PubMed DOI

生成式人工智慧(GAI)在醫療領域有顯著進展,但對於罕見疾病如原發性免疫疾病(PI)的輔助效果仍待探討。本研究評估了六種大型語言模型(LLMs)在提供PI臨床指導的表現。結果顯示,GPT-4o、Llama-3.1-70B-Instruct和Mistral-Large-Instruct-2407的診斷準確率超過88%,其中GPT-4o以96.2%領先。其他模型表現較差,準確率約60%或更低。雖然LLMs在PI診斷上顯示潛力,但仍需改進以提升臨床實用性。 PubMed DOI

這項研究探討了生成預訓練變壓器(GPT)模型,特別是GPT-3.5、GPT-4和GPT-4o,如何在非結構化病人筆記中識別與免疫檢查點抑制劑(ICI)療法相關的免疫相關不良事件(irAEs)。分析了442名病人,發現常見的irAEs包括肺炎、結腸炎、皮疹和肝炎。雖然GPT模型在敏感性和特異性上表現良好,但正向預測值中等,顯示出過度預測的傾向。GPT-4o在血液、胃腸和肌肉骨骼類別中表現最佳。研究建議這些模型可自動化檢測irAEs,減輕醫療人員負擔,增強病人安全監測。 PubMed DOI