原始文章

這項研究探討了生成預訓練變壓器(GPT)模型,特別是GPT-3.5、GPT-4和GPT-4o,如何在非結構化病人筆記中識別與免疫檢查點抑制劑(ICI)療法相關的免疫相關不良事件(irAEs)。分析了442名病人,發現常見的irAEs包括肺炎、結腸炎、皮疹和肝炎。雖然GPT模型在敏感性和特異性上表現良好,但正向預測值中等,顯示出過度預測的傾向。GPT-4o在血液、胃腸和肌肉骨骼類別中表現最佳。研究建議這些模型可自動化檢測irAEs,減輕醫療人員負擔,增強病人安全監測。 PubMed DOI


站上相關主題文章列表

LLMs如GPT-3.5透過VAERS數據,展現了辨識疫苗相關不良事件的潛力。研究專注於1990至2016年的案例,特別研究流感疫苗。經過調整的AE-GPT模型在提取不良事件方面表現良好,顯示LLMs在處理醫學數據和推進不良事件檢測任務上有潛力。 PubMed DOI

研究指出GPT-4在辨識胃腸道出血方面表現優異,準確率高達94.4%,比ICD碼更好。與人工審查相比,表現相當或稍微差一點。GPT-4效率高、成本低,可快速分析數據,是臨床事件分類的可靠替代方案,有助於提升臨床研究品質。未來研究應該探討高效人工智慧模型在臨床數據處理的可擴展性、模型調整和道德影響。 PubMed DOI

使用大型語言模型如GPT-3.5 Turbo和GPT-4可提升臨床試驗患者配對的效率和準確性。研究顯示GPT-4在患者記錄和AI技術中表現優異,有助於減少招募錯誤、減輕研究負擔、加速研究。然而,仍需進一步研究以驗證其在實際臨床數據中的效用。 PubMed DOI

研究使用OpenAI的GPT-4模型分析非小細胞肺癌患者的電子健康記錄,結果顯示GPT-4在識別疾病階段、治療和進展方面比其他模型表現更好。這表示GPT-4在臨床表現型提取上比基於規則的模型更有效率,具有更高的精確度、召回率和F1分數。GPT模型在醫療領域有著重要的應用價值,因為它們提供了更好的上下文理解和臨床表現型識別能力。 PubMed DOI

這項研究開發了一個基於人工智慧的異常檢測模型,幫助醫療人員識別新型疾病並防止疫情擴散。模型使用來自麻薩諸塞州一所醫院的120,714名住院病人數據,基於生成預訓練變壓器(GPT)架構,並透過經驗風險最小化進行訓練。它分析電子健康紀錄,檢測不尋常的病人特徵,並在COVID-19疫情初期成功預測住院情況,達到92.2%的準確率。該模型在異常檢測和死亡預測上表現優異,顯示出在現代醫療中的潛力。 PubMed DOI

本研究評估大型語言模型(LLM),特別是GPT-4,是否能有效分析介入放射學(IR)微波消融裝置的安全事件數據。研究收集了2011年至2023年的安全數據,並由人類審核者進行分類。GPT-4的分類準確率在訓練集達96.0%,驗證集86.4%,測試集87.3%。最終生成的摘要與人類解讀相似,顯示LLM在處理IR安全數據方面的潛力,成為臨床醫生的有用工具。 PubMed DOI

這項研究探討大型語言模型(LLMs)在識別接受免疫檢查點抑制劑(ICI)治療患者的免疫相關不良事件(irAEs)中的應用,並與傳統手動裁定及ICD代碼進行比較。研究分析了超過12年的住院紀錄,發現LLMs在檢測irAEs的敏感性顯著高於ICD代碼,且效率更佳,平均每份病歷僅需9.53秒。總體來說,LLMs被認為是檢測irAEs的有效工具,提供更高的敏感性和效率。 PubMed DOI

這項研究評估了大型語言模型(LLMs),特別是GPT-3.5和GPT-4,在從腫瘤科電子健康紀錄中提取患者共病情況的表現。研究分析了250份病歷報告,結果顯示GPT-4在敏感性上表現優於GPT-3.5和醫生,達到96.8%。雖然醫生在精確度上稍勝一籌,但GPT-4的表現更一致,且能推斷出非明確的共病情況。整體而言,這些模型在提取資訊方面顯示出潛力,可能成為數據挖掘的重要工具。 PubMed DOI

透過結構化數據來識別免疫抑制患者相當困難,但像GPT-4o這樣的大型語言模型在從非結構化的臨床文本中提取結構化概念方面表現優異。我們的研究顯示,GPT-4o在分析住院紀錄時,能有效識別免疫抑制狀況和藥物使用,超越傳統方法。此外,這種技術也能成功應用於外部數據集。雖然GPT-4o mini和Llama 3.1等成本較低的模型也有不錯的表現,但仍無法與GPT-4o相比。 PubMed DOI

這項研究探討COVID-19疫苗與不良事件的關聯,數據來自疫苗不良事件報告系統(VAERS)及社交媒體如Twitter和Reddit。分析了771對關聯,識別不同疫苗接種後的不良事件模式。使用了先進模型如GPT-3.5、GPT-4等進行關聯提取,並透過後處理規則精煉結果。經微調的GPT-3.5達到0.94的精確度和1的召回率。主要疫苗接種後常見的不良事件有手臂酸痛、疲勞和頭痛,而加強針則報告了更多不良事件,顯示大型語言模型在疫苗安全監測中的潛力。 PubMed DOI