LLM 相關三個月內文章 / 第 37 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

雖然非結構化電子病歷資料有助提升兒童用藥安全,但目前用來偵測兒童不良藥物事件的研究還很少。傳統NLP方法在語境理解和應用上有限。新一代AI模型如transformers和大型語言模型,有望突破這些限制,讓大規模監測兒童不良藥物事件變得更有效率。 相關文章 PubMed DOI 推理

這項研究發現,AI(GPT-4o Plus)用 CBCA 方法評估兒童性侵陳述時,和法醫心理師、社工師的判斷落差很大,尤其在需要細膩判斷的地方更明顯。AI 的推理方式和專家差很多,信度分數甚至有負值。結論是,AI 現階段還不能取代專家,但可以當作輔助工具。 相關文章 PubMed DOI 推理

像 ChatGPT 這類 AI 工具能快速整理和分析囓齒類動物飲食相關研究,協助研究人員和審稿人評估設計和營養素影響。雖然 AI 能提升審稿效率,但還是要靠專業判斷,不能完全取代人。這樣運用 AI,有助於提升相關研究的品質。 相關文章 PubMed DOI 推理

這項研究開發了「Systematic Review Extractor Pro」GPT工具,可大幅加快健康科學系統性文獻回顧的資料擷取速度,每篇僅需約27秒,且與人工審查一致率高達九成以上。工具在擷取研究與受試者特徵特別準確,但對複雜方法和統計資料準確度較低。雖然已開放使用,仍需更多研究來確認其穩定性與適用範圍。 相關文章 PubMed DOI 推理

這篇論文提出EIM訓練法,能有效提升多模態大型語言模型(同時處理圖片和文字)的表現,且不需增加參數或改動模型架構。EIM針對影像編碼、語意對齊和訓練流程做優化。實驗證明,EIM強化後的模型在多項基準測試上表現優異,甚至可媲美更大型的模型,是提升多模態LLM的有效方法。 相關文章 PubMed DOI 推理

這項研究推出 ChatRadio-Valuer,是首個專為一般放射診斷設計、可在醫院內部運作的大型語言模型。它在多種疾病和不同醫院都表現優異,臨床任務甚至勝過 GPT-3.5/4 和平均放射科醫師。模型支援 zero-shot 學習,能保障病患隱私,適合大規模臨床應用,強調在地化 LLM 的重要性。 相關文章 PubMed DOI 推理

GPT4Point 和 GPT4Point++ 是專門用來處理 3D 點雲和文字的多模態 AI 模型,能更準確地辨識、描述和回答 3D 物件相關問題。GPT4Point 用兩階段訓練,GPT4Point++ 則直接端到端訓練,效果更好。作者也推出了大規模 3D 點雲配對資料集 Capverse。實驗證明這些模型在 3D 理解和生成上表現很強。 相關文章 PubMed DOI 推理

這項研究比較六種大型語言模型在20個眼整形病例的診斷表現。OcuSmart/EyeGPT 最常正確找出首要診斷,Claude 3.5 的診斷清單涵蓋率最高,Google Gemini 則給出最精簡的答案。不同病例類型下,模型表現也會變化。整體來說,LLMs 在眼整形診斷輔助有潛力,但臨床應用前還需要更多驗證。 相關文章 PubMed DOI 推理

這項研究發現,DeepSeek-R1 在整形外科相關任務的表現普遍優於 ChatGPT-4.5,尤其在需要臨床細節的複雜問題上更突出;而 ChatGPT-4.5 則適合簡潔、概括性的回答。兩者都能輔助臨床與教學,但不能取代專業醫師判斷。 相關文章 PubMed DOI 推理

這項研究發現,GPT-4在判讀胸部CT報告、分類縱膈腫瘤的準確率達73.3%,跟資深放射科醫師差不多。特別是在報告品質較差或診斷淋巴瘤時,GPT-4表現甚至更好。顯示GPT-4未來有機會協助醫師處理較難或資訊不足的病例。 相關文章 PubMed DOI 推理