原始文章

這項研究開發了一套免寫程式碼、全自動化的方法,利用GPT-4o mini從50份藥品說明書中擷取兒童用藥資訊。辨識兒科適應症時,召回率高達95%、精確率有78%,證明大型語言模型能有效分類適合兒童的藥物。這工具讓沒IT背景的醫療人員也能輕鬆操作。 PubMed DOI


站上相關主題文章列表

這項研究比較了不同語言模型在從電子健康記錄中提取藥物劑量信息方面的表現。結果顯示,GPT-4在準確標註藥物使用說明方面優於其他模型。該研究指出,像GPT-4這樣的大型語言模型有潛力自動化從醫療文本來源中提取有價值信息,減少手動標註的需求。 PubMed DOI

這項研究探討大型語言模型(LLMs)在生成重症監護病房(ICU)病人出院摘要的表現,分析了匿名臨床筆記。三個模型中,GPT-4 API的表現最佳,準確識別41.5%的關鍵臨床事件,ChatGPT和Llama 2則分別為19.2%和16.5%。雖然GPT-4在資訊組織和清晰度上表現優異,但仍有小錯誤,且所有模型在敘事連貫性和重要數據的捕捉上存在挑戰。總體來看,這些LLM在生成出院摘要上有潛力,但仍需改進。 PubMed DOI

這項初步研究顯示,針對慢性病兒童的病患教育資源有明顯不足,並評估大型語言模型(LLMs)在提供適合發展階段解釋的能力。研究結果發現,兩個常用的LLMs能夠生成準確且有效的回應,幫助兒科病患理解複雜的醫療資訊。這顯示LLMs可能成為提升病患理解與參與臨床環境的重要工具。 PubMed DOI

診斷罕見兒科疾病相當具挑戰性,因為這些疾病的表現複雜。本研究評估了三種大型語言模型(LLMs)的診斷表現:GPT-4、Gemini Pro,以及一個整合Human Phenotype Ontology的自訂模型(GPT-4 HPO),針對61個罕見疾病進行分析。結果顯示,GPT-4的準確率為13.1%,而GPT-4 HPO和Gemini Pro均為8.2%。特別是GPT-4 HPO在鑑別診斷和疾病分類上表現較佳。這些結果顯示大型語言模型在診斷支持上有潛力,但仍需改進以便更好地融入臨床實踐。 PubMed DOI

這項研究探討了利用生成式人工智慧(GenAI)自動提取PICO(人口、介入、比較、結果)元素的方法,對於系統文獻回顧(SLRs)非常重要。考量到歐盟健康技術評估法規的要求,研究評估了GenAI在此任務上的可行性和效率。 研究人員從PubMed檢索了682,667篇隨機對照試驗的摘要,使用OpenAI的GPT-4o進行處理,PICO元素提取在三小時內完成,平均每1,000篇摘要處理時間為200秒。驗證結果顯示,GPT-4o準確提取了98%的PICO元素,顯示GenAI能顯著提升SLRs的效率,幫助製藥開發者更好地應對健康技術評估。 PubMed DOI

本研究評估了GPT-3.5和GPT-4在從非結構化臨床文本中提取資訊的效果。使用了病人特徵、病史和臨床檢測結果的資料,並透過簡單提示進行查詢。結果顯示,GPT-4在性別資訊提取上準確率達95%,優於GPT-3.5的70%;但在身體質量指數(BMI)方面,GPT-3.5的78%表現更佳。研究建議整合特定任務的定義進入提示中,以提升提取效果,並鼓勵專業人士設計有效提示,監控大型語言模型的表現。 PubMed DOI

在兒科護理中,藥物計算錯誤仍然是一大挑戰。本研究探討大型語言模型(LLMs)如ChatGPT-4o和Claude-3.0在減少這些錯誤的效果,並與經驗豐富的護理人員進行比較。結果顯示,LLMs的準確率達100%,而護理人員為93.14%。此外,LLMs的計算速度也顯著更快。研究建議進一步探索這些模型在醫療環境中的應用潛力,以提升藥物安全性和臨床效率。 PubMed DOI

這項研究探討了一個微調過的GPT-3模型在農村醫療環境中對兒科病例診斷的有效性,因為這些地區專家資源有限。研究分析了路易斯安那州中部的500個兒科就診案例,發現模型準確率達87.3%,敏感度和特異度分別為85%和90%,與兒科醫生的91.3%相當。模型在不同年齡組和常見病症中表現穩定,但對罕見診斷的準確率稍低。總體來說,這個微調的GPT-3模型可作為農村兒科護理的可靠診斷工具,但仍需在不同人群中進一步驗證。 PubMed DOI

重點整理: 雖然AI正在改變醫學領域,但在小兒科方面的研究還很少。這項研究發現,一個免費、未經專門訓練的大型語言模型,針對13種常見小兒感染情境,能夠提供可靠的抗生素處方建議。 PubMed DOI

這項研究發現,GPT-4o等大型語言模型能根據實際用藥情境(如劑量)準確判斷藥物的ATC分類,表現比傳統搜尋方法更好(92.5%對82.5%)。LLM不僅準確、取得容易,還能考慮情境資訊,對藥物流行病學研究很有幫助。 PubMed DOI