原始文章

小兒肺炎診斷困難,影響幼童生命。P2Med-MLLM是一款結合文字和醫學影像分析的AI模型,能協助醫師更快更準確診斷與治療。實測結果顯示,這個模型比現有方法更有效率,有助於提升醫療品質並拯救更多孩子的生命。 PubMed DOI


站上相關主題文章列表

傳統的預訓練和微調方法對於常見疾病有效,但對於罕見職業病如塵肺診斷困難。大型語言模型(LLMs)在多任務對話診斷中有潛力。新策略使用適配器層進行視覺-語言對齊,透過對話診斷,雖然挑戰性高,但可提高LLMs效果。移除文本分支、替換對話頭為分類頭,以增進LLMs效能。引入上下文多令牌引擎平衡圖像資訊和準確診斷,並使用信息發射器模塊單向信息流。實驗證實這些方法有效。 PubMed DOI

生成式人工智慧,特別是大型語言模型(LLMs),在兒科教育和訓練上有很大潛力。這些模型能幫助教育者改善課程設計、制定個性化學習計畫,並提供即時反饋,還能協助醫生簡化資訊搜尋,提升診所效率。不過,LLMs也可能產生不準確資訊,並引發偏見和倫理問題。因此,專業人士需謹慎使用並審查其輸出。為確保安全有效的應用,相關方應建立明確的指導方針和政策。本文探討了LLMs在兒科教育中的歷史、應用及挑戰。 PubMed DOI

這項研究指出,人工智慧(AI)在兒童放射學的應用上存在重大差距,特別是針對最新的大型語言模型(LLMs),如GPT-4、Gemini 1.5 Pro和Claude 3 Opus。測試結果顯示,這些模型在90張兒童放射影像中,正確診斷率僅27.8%,部分正確率13.3%,錯誤率高達58.9%。研究顯示,儘管多模態LLMs能處理多種輸入,但目前仍缺乏準確解讀兒童放射影像的專業能力。 PubMed DOI

這項初步研究顯示,針對慢性病兒童的病患教育資源有明顯不足,並評估大型語言模型(LLMs)在提供適合發展階段解釋的能力。研究結果發現,兩個常用的LLMs能夠生成準確且有效的回應,幫助兒科病患理解複雜的醫療資訊。這顯示LLMs可能成為提升病患理解與參與臨床環境的重要工具。 PubMed DOI

這項研究探討了多模態大型語言模型(LLMs),特別是GPT-4o和Claude Sonnet 3.5,如何結合文本與視覺資訊進行醫療診斷。研究在120個臨床案例中進行測試,結果顯示在只有文本的情況下,GPT-4o的準確率為70.8%,遠超醫生的39.5%。當加入圖片時,所有參與者的表現都有提升,尤其是醫生的準確率增幅最明顯。GPT-4o在有圖片的情況下達到84.5%,而醫生則為78.8%。這顯示LLMs在視覺數據處理上仍需加強,以達到人類醫生的表現。 PubMed DOI

這項研究探討了一個微調過的GPT-3模型在農村醫療環境中對兒科病例診斷的有效性,因為這些地區專家資源有限。研究分析了路易斯安那州中部的500個兒科就診案例,發現模型準確率達87.3%,敏感度和特異度分別為85%和90%,與兒科醫生的91.3%相當。模型在不同年齡組和常見病症中表現穩定,但對罕見診斷的準確率稍低。總體來說,這個微調的GPT-3模型可作為農村兒科護理的可靠診斷工具,但仍需在不同人群中進一步驗證。 PubMed DOI

重點整理: 雖然AI正在改變醫學領域,但在小兒科方面的研究還很少。這項研究發現,一個免費、未經專門訓練的大型語言模型,針對13種常見小兒感染情境,能夠提供可靠的抗生素處方建議。 PubMed DOI

這項研究發現,雖然Claude等大型語言模型在小兒腎臟科案例上表現最佳,正確率達86.9%,但所有模型都會出現幻覺,甚至可能給出危險建議。即使用專業資料微調,推理能力也沒提升。目前LLM只能在嚴格監督下協助重複性工作,還不適合獨立臨床應用,未來需加強可靠性與可解釋性。 PubMed DOI

這項研究比較五款主流大型語言模型解讀胸部CT報告的能力,發現GPT-4表現最佳,尤其在選擇題上最準確。微調後的GPT-3.5-Turbo也有明顯進步。整體來說,選擇題比開放式問答更容易答對。不同疾病和器官系統的結果有差異。結果顯示,優化後的AI模型有助於提升胸部CT解讀,對外科手術規劃很有幫助。 PubMed DOI

這項研究提出結合特徵摘要、思路鏈推理和混合型RAG架構的新提示工程方法,能提升大型語言模型判讀胸部CT報告、診斷肺部疾病的準確度。用2,965份報告測試,結果比傳統深度學習和其他提示法更準,外部驗證也表現優異。此方法不僅提升可解釋性,也有助臨床更精確診斷。 PubMed DOI