Improving Personalized Meal Planning with Large Language Models: Identifying and Decomposing Compound Ingredients.
利用大型語言模型提升個人化餐點規劃：複合性食材的辨識與分解 Nutrients 2025-05-14

這項研究比較 GPT-4o、Llama-3 (70B) 和 Mixtral (8x7B) 三款大型語言模型，發現 Llama-3 (70B) 和 GPT-4o 拆解餐點成分的表現都比 Mixtral 好，尤其 Llama-3 (70B) 準確率和 F1-score 都最高。結果顯示，像 Llama-3 這類開源模型，對個人化營養和餐點客製化很有幫助。相關文章 PubMed DOI 推理

Enhancing Radiologist Productivity with Artificial Intelligence in Magnetic Resonance Imaging (MRI): A Narrative Review.
以人工智慧提升磁振造影（MRI）放射科醫師生產力：敘述性回顧 Diagnostics (Basel) 2025-05-14

這篇綜述分析67篇AI應用於MRI的研究，發現AI能加快掃描和判讀速度、自動分割影像，提升工作效率。常用技術有ResNet、U-Net等卷積神經網路。雖然AI表現不錯，但因外部驗證不足、資料集不一致，臨床應用還有限。未來需更多標準化研究，才能讓AI安全有效地用在臨床MRI。相關文章 PubMed DOI 推理

Pre- Trained Language Models for Mental Health: An Empirical Study on Arabic Q&A Classification.
用於心理健康的預訓練語言模型：阿拉伯語問答分類的實證研究 Healthcare (Basel) 2025-05-14

這項研究比較多種阿拉伯語預訓練語言模型在心理健康問答分類的表現，發現 MARBERT 等 PLMs 效果明顯優於傳統方法。透過進一步微調或用 GPT-3.5 少量學習，準確率還能提升，顯示 PLMs 有助於提升阿拉伯語心理健康支援的可行性與效果。相關文章 PubMed DOI 推理

Using Large Language Models for Advanced and Flexible Labelling of Protocol Deviations in Clinical Development.
在臨床開發中運用大型語言模型進行先進且彈性的試驗偏差標註 Ther Innov Regul Sci 2025-05-13

臨床試驗中，方案偏差（PDs）定義不一，難以有效辨識關鍵影響。傳統用NLP分類PDs又慢又複雜。這項研究用Meta Llama2大型語言模型，開發自動化系統，能快速分類Roche系統裡的PDs，自動標記出超過八成可能影響結果的PDs，讓專家能聚焦審查，大幅提升效率，幾分鐘就能得到有用見解。相關文章 PubMed DOI 推理

A framework to assess clinical safety and hallucination rates of LLMs for medical text summarisation.
用於醫學文本摘要之大型語言模型（LLMs）臨床安全性與幻覺率評估框架 NPJ Digit Med 2025-05-13

這項研究提出一套新框架，能提升大型語言模型（LLM）生成臨床紀錄的準確性與安全性。透過錯誤分類、反覆評估、臨床安全性檢查和CREOLA介面，分析近1.3萬句臨床標註句子後，發現幻覺率1.47%、遺漏率3.45%。經優化後，重大錯誤率甚至比人類醫師還低，顯示這方法有助於提升LLM臨床應用的安全性。相關文章 PubMed DOI 推理

Token-Mol 1.0: tokenized drug design with large language models.
Token-Mol 1.0：結合大型語言模型的分子藥物設計標記化方法 Nat Commun 2025-05-13

Token-Mol 是專為藥物設計打造的新型 transformer 架構，能同時編碼分子的 2D 和 3D 資訊。它用創新損失函數提升回歸表現，在分子構象生成、性質預測和藥物分子設計上都優於傳統模型，運算速度也比 diffusion models 快很多。結合強化學習後，藥物開發成效會更好。相關文章 PubMed DOI 推理

Evaluation of ChatGPT responses to common patient questions on ankle fusion.
ChatGPT 回應常見有關踝關節融合手術病人問題之評估 Foot Ankle Surg 2025-05-13

**重點整理：** 這項研究發現，ChatGPT 4.0 對於有關踝關節融合手術的常見病人問題，通常能提供正確且品質尚可的回答，但它的回覆內容用詞偏艱深，平均閱讀程度約在11.6年級，對很多病人來說理解上會有困難。相關文章 PubMed DOI 推理

Comparing ChatGPT and Dental Students' Performance in an Introduction to Dental Anatomy Examination: A Cross-Sectional Study.
ChatGPT 與牙醫學生在牙齒解剖學導論考試表現之比較：一項橫斷式研究 Eur J Dent 2025-05-13

這項研究發現，牙醫系學生在牙齒解剖學選擇題考試的表現優於ChatGPT，學生平均分數74.28%，ChatGPT則為60%。雖然ChatGPT有基本理解力，能及格，但準確度和可靠性還是不夠，所以不建議單靠它來學牙齒解剖學。相關文章 PubMed DOI 推理

Evaluating large language and large reasoning models as decision support tools in emergency internal medicine.
將標題「Evaluating large language and large reasoning models as decision support tools in emergency internal medicine.」翻譯為繁體中文(zh-TW)如下：「評估大型語言模型與大型推理模型作為急診內科決策支援工具的應用」 Comput Biol Med 2025-05-13

最新研究發現，OpenAI 的 o1 LLM 在急診臨床決策上表現跟醫師差不多，診斷和收治判斷準確率都超過九成，甚至在異常檢驗判讀上還拿到滿分。相比之下，Claude-3.5-Sonnet 和 Llama-3.2-70B 在治療計畫上表現較弱。整體來說，o1 有機會成為急診醫療現場的專業決策輔助工具。相關文章 PubMed DOI 推理

Use of an Untrained Large Language Model for Antibiotic Prescription in Pediatric Infectious Diseases at Primary Care Settings: A Study From the Italian Society for Pediatric Infectious Diseases.
未經訓練的大型語言模型於基層醫療環境中兒科感染症抗生素處方之應用：義大利兒科感染症學會研究 Pediatr Infect Dis J 2025-05-13

重點整理：雖然AI正在改變醫學領域，但在小兒科方面的研究還很少。這項研究發現，一個免費、未經專門訓練的大型語言模型，針對13種常見小兒感染情境，能夠提供可靠的抗生素處方建議。相關文章 PubMed DOI 推理

LLM 相關三個月內文章 / 第 121 頁

可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

LLM 相關三個月內文章 / 第 121 頁

可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

可選擇其它分類: 一週新進文章腎臟科一般醫學 SGLT2i GLP1