LLM 相關三個月內文章 / 第 120 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究比較 GPT-4o、Llama-3 (70B) 和 Mixtral (8x7B) 三款大型語言模型,發現 Llama-3 (70B) 和 GPT-4o 拆解餐點成分的表現都比 Mixtral 好,尤其 Llama-3 (70B) 準確率和 F1-score 都最高。結果顯示,像 Llama-3 這類開源模型,對個人化營養和餐點客製化很有幫助。 相關文章 PubMed DOI 推理

這篇綜述分析67篇AI應用於MRI的研究,發現AI能加快掃描和判讀速度、自動分割影像,提升工作效率。常用技術有ResNet、U-Net等卷積神經網路。雖然AI表現不錯,但因外部驗證不足、資料集不一致,臨床應用還有限。未來需更多標準化研究,才能讓AI安全有效地用在臨床MRI。 相關文章 PubMed DOI 推理

這項研究比較多種阿拉伯語預訓練語言模型在心理健康問答分類的表現,發現 MARBERT 等 PLMs 效果明顯優於傳統方法。透過進一步微調或用 GPT-3.5 少量學習,準確率還能提升,顯示 PLMs 有助於提升阿拉伯語心理健康支援的可行性與效果。 相關文章 PubMed DOI 推理

臨床試驗中,方案偏差(PDs)定義不一,難以有效辨識關鍵影響。傳統用NLP分類PDs又慢又複雜。這項研究用Meta Llama2大型語言模型,開發自動化系統,能快速分類Roche系統裡的PDs,自動標記出超過八成可能影響結果的PDs,讓專家能聚焦審查,大幅提升效率,幾分鐘就能得到有用見解。 相關文章 PubMed DOI 推理

這項研究提出一套新框架,能提升大型語言模型(LLM)生成臨床紀錄的準確性與安全性。透過錯誤分類、反覆評估、臨床安全性檢查和CREOLA介面,分析近1.3萬句臨床標註句子後,發現幻覺率1.47%、遺漏率3.45%。經優化後,重大錯誤率甚至比人類醫師還低,顯示這方法有助於提升LLM臨床應用的安全性。 相關文章 PubMed DOI 推理

Token-Mol 是專為藥物設計打造的新型 transformer 架構,能同時編碼分子的 2D 和 3D 資訊。它用創新損失函數提升回歸表現,在分子構象生成、性質預測和藥物分子設計上都優於傳統模型,運算速度也比 diffusion models 快很多。結合強化學習後,藥物開發成效會更好。 相關文章 PubMed DOI 推理

**重點整理:** 這項研究發現,ChatGPT 4.0 對於有關踝關節融合手術的常見病人問題,通常能提供正確且品質尚可的回答,但它的回覆內容用詞偏艱深,平均閱讀程度約在11.6年級,對很多病人來說理解上會有困難。 相關文章 PubMed DOI 推理

這項研究發現,牙醫系學生在牙齒解剖學選擇題考試的表現優於ChatGPT,學生平均分數74.28%,ChatGPT則為60%。雖然ChatGPT有基本理解力,能及格,但準確度和可靠性還是不夠,所以不建議單靠它來學牙齒解剖學。 相關文章 PubMed DOI 推理

最新研究發現,OpenAI 的 o1 LLM 在急診臨床決策上表現跟醫師差不多,診斷和收治判斷準確率都超過九成,甚至在異常檢驗判讀上還拿到滿分。相比之下,Claude-3.5-Sonnet 和 Llama-3.2-70B 在治療計畫上表現較弱。整體來說,o1 有機會成為急診醫療現場的專業決策輔助工具。 相關文章 PubMed DOI 推理

重點整理: 雖然AI正在改變醫學領域,但在小兒科方面的研究還很少。這項研究發現,一個免費、未經專門訓練的大型語言模型,針對13種常見小兒感染情境,能夠提供可靠的抗生素處方建議。 相關文章 PubMed DOI 推理