原始文章

虐待性頭部創傷(AHT)是幼兒死亡的重要原因,特別在急救醫療服務(EMS)中,識別此情況相當困難。本研究利用人工智慧(AI)和大型語言模型(LLMs)分析EMS的敘述文件,以檢測36個月以下有頭部受傷的兒童是否有AHT。研究顯示,增強的自然語言處理框架具備高敏感性(92.3%)和特異性(72.4%),能有效提升AHT的檢測能力,改善幼兒的醫療結果。 PubMed DOI


站上相關主題文章列表

這項研究評估了大型語言模型ChatGPT-4在從微型交通事故的臨床筆記中提取頭盔使用狀態的效果。研究人員比較了文本搜尋和LLM兩種方法,發現低、中等詳細程度的提示下,兩者一致性中等,而高詳細程度則幾乎完美,但耗時較長。LLM在有效性上表現良好,但在可靠性和一致性上仍有問題,經常出現錯誤。總體來說,雖然LLM在信息提取上效率高,但在臨床應用中仍面臨挑戰。 PubMed DOI

這項研究探討如何利用自然語言處理(NLP)和機器學習(ML)技術,來識別急診部分診筆記中的熱性痙攣,特別針對6歲以下接種疫苗後的兒童。研究強調收集疫苗接種後不良事件數據的重要性,並開發了基準模式匹配方法來分類熱性痙攣。結果顯示,基於變壓器的模型在實時監測中表現優於傳統神經網絡,且足夠的訓練數據對模型效能至關重要。這項研究顯示NLP技術在疫苗不良事件監測中的潛力。 PubMed DOI

這項研究比較了三層級的分診協議,包括分診護士、急診醫師和人工智慧模型(ChatGPT、Gemini 和 Pi),在2024年4月1日至4月7日於一所三級醫療機構的急診部門進行,分析了500名病人的數據。結果顯示,只有23.8%的病人獲得一致分類,分診護士對6.4%的病人過度分診,且人工智慧模型的分診不足率偏高,特別是ChatGPT在黃碼和紅碼病人中分診不足達26.5%和42.6%。結論指出,急診環境中不應僅依賴人工智慧進行分診。 PubMed DOI

這項研究評估了GPT-4在急診病人分診中所給的緊急嚴重指數(ESI)分數的準確性,並與經驗豐富的醫護人員進行比較。研究涵蓋100名急診病人,結果顯示GPT-4的中位數ESI分數為2.0,而人類評估者為3.0,顯示出顯著差異(p < 0.001),顯示GPT-4可能低估病人嚴重程度。雖然GPT-4提供了新方法,但其低估的傾向顯示在臨床應用中需進一步調整,強調謹慎整合AI技術的重要性。 PubMed DOI

傷害是全球健康的重要議題,具高發病率與死亡率。有效的傷害監測對預防至關重要,但通常需耗費大量資源。本研究專注於利用大型語言模型(LLMs)從急診部的臨床筆記中提取傷害相關資訊。研究使用了來自兩所城市學術醫院的數據,評估Llama-2模型在提取傷害機制、地點、活動、意圖和嚴重性方面的準確性。結果顯示,Llama-2模型在各項任務中表現優於BERT模型,顯示出其在傷害監測與預防中的潛力。 PubMed DOI

近年來,利用人工智慧(AI)進行嬰兒疾病檢測和預測的研究逐漸增多。研究回顧了2018至2022年間的154篇相關文章,顯示研究活動明顯上升,涵蓋十二種ICD-11疾病類別,特別是產前疾病。AI模型主要使用臨床、人口統計和實驗室數據進行訓練,深度神經網絡成為主流方法。研究結果顯示,AI在嬰兒診斷中具潛力,未來大型語言模型的發展預期將進一步推動這一領域的進步。 PubMed DOI

最近大型語言模型(LLMs)在臨床推理方面的進展顯示出其在緊急醫療服務(EMS)中分診病人的潛力。一項研究測試了ChatGPT 4o Mini在美國某大城市的真實數據中,優先處理救護車請求的能力。結果顯示,該模型與經驗豐富的救護員意見一致的比例達76.5%,而在救護員達成共識的情況下,這一比例高達93.8%。這些發現顯示LLMs在緊急護理中可能成為有價值的工具,但仍需進一步研究以確定最佳應用方式。 PubMed DOI

這項研究探討如何利用大型語言模型(LLMs)從兒童保護服務(CPS)的案例報告中提取結構化數據,特別是識別不同的暴力子類型。研究流程分為四個階段,並分析了來自瑞士的29,770份報告,提取了28,223個文本段落。表現最佳的模型Mixtral-8x7B在文本分類中達到87%的準確率,超過人類審查員的77%協議率。結果顯示,LLMs能有效模擬人類的編碼能力,提升CPS研究的質量,但也需注意文本分段的弱點及潛在偏見。 PubMed DOI

這項研究評估了生成式人工智慧模型在預測小兒急診病人緊急嚴重指數(ESI)等級的表現,發現幾個關鍵見解: 1. **模型表現**:Claude-3 Opus 在未經訓練的模型中表現最佳,敏感度80.6%、特異度91.3%。 2. **微調影響**:微調後的 GPT-4.0 顯示顯著改善,敏感度77.1%、特異度92.5%。 3. **可靠性評估**:Claude-3 Opus 的一致性最高(κ: 0.85),顯示出強烈的評分者間可靠性。 4. **統計分析**:微調前後的比較顯示 GPT 模型有顯著改善。 5. **結論**:生成式人工智慧模型能準確預測小兒 ESI 等級,微調後表現更佳,成為急診分診的有價值工具。 PubMed DOI

這項研究探討了從電子病歷中檢測肺栓塞不良事件的挑戰,並開發了一個利用大型語言模型的框架。研究回顧了2017至2022年間的病歷,發現40例肺栓塞不良事件,流行率為0.4%。框架包含證據提取、出院資訊提取和PEAE檢測三個模組,評估了四個開源模型,結果顯示高敏感性和特異性。研究強調關鍵字過濾和出院摘要的納入能改善性能,並建議未來應加強上下文理解和醫學術語解釋,以提升檢測能力。 PubMed DOI