Leveraging Large Language Models for Accurate Retrieval of Patient Information From Medical Reports: Systematic Evaluation Study.
運用大型語言模型精確擷取醫療報告中的病患資訊：系統性評估研究 JMIR AI 2025-07-03

這項研究用 Python 的 LangChain 框架，評估 GPT-4o、Llama 等大型語言模型，從醫療報告自動擷取結構化資料。GPT-4o 準確率最高（91.4%），但各模型在姓名、年齡處理上有缺點。LLMs 有助提升醫療資料管理，但仍有表現不穩和幻覺等問題，未來應加強訓練資料和提示設計。相關文章 PubMed DOI 推理

A Large Language Model-Powered Map of Metabolomics Research.
大型語言模型驅動的代謝體學研究地圖 Anal Chem 2025-07-03

我們用先進語言模型分析八萬多篇代謝體學論文，找出20個主要研究主題，像是深度學習應用、生物標誌物發現等新趨勢。透過互動網頁（https://metascape.streamlit.app/），大家可以自己探索這些分析結果，幫助快速掌握代謝體學的最新發展。相關文章 PubMed DOI 推理

spaLLM: enhancing spatial domain analysis in multi-omics data through large language model integration.
spaLLM：透過大型語言模型整合，提升多重體學資料的空間域分析 Brief Bioinform 2025-07-03

spaLLM 是一套創新的空間多重體學分析工具，結合大型語言模型、圖神經網路和多視角注意力機制，即使基因表現資料很稀疏，也能精準辨識空間區域。它支援多種體學資料，表現優於現有主流方法，程式碼已開源於 GitHub。相關文章 PubMed DOI 推理

Generative Design of Functional Metal Complexes Utilizing the Internal Knowledge and Reasoning Capability of Large Language Models.
利用大型語言模型內部知識與推理能力進行功能性金屬錯合物的生成式設計 J Am Chem Soc 2025-07-03

LLM-EO 結合大型語言模型和演化式最佳化，能用自然語言輕鬆設計過渡金屬錯合物，支援少量樣本和多目標最佳化。它能整合各種資料，產生新穎分子，未來在化學和材料科學領域很有發展潛力。相關文章 PubMed DOI 推理

Comparative analysis of artificial intelligence tools for the dissemination of colorectal cancer screening guidelines: a novel perspective on early screening education.
人工智慧工具於大腸直腸癌篩檢指引推廣之比較分析：早期篩檢教育的新視角 Int J Surg 2025-07-03

這項研究比較三款 AI 解釋大腸癌篩檢指引的表現。DeepSeek 在在地化和邏輯細節上最好，但標準正確性待加強；ChatGPT-4o 用了舊標準，對高風險族群說明太簡略；Claude3.5 解釋詳盡但漏掉實務細節。整體來說，AI 有助提升醫療指引的易懂度，但內容仍需專家把關與倫理監督。相關文章 PubMed DOI 推理

CAS: enhancing implicit constrained data augmentation with semantic enrichment for biomedical relation extraction and beyond.
CAS：以語意增強提升隱式約束式資料增補於生醫關係擷取及其延伸應用 Database (Oxford) 2025-07-03

CAS 是專為生醫關係抽取等有嚴格結構限制任務設計的資料增強框架，利用大型語言模型產生多樣且合規的資料，並用自我評估過濾器（SemQ）確保品質與一致性。CAS 能維持資料完整性，提升模型表現，適用於多種有約束的 NLP 任務。程式碼連結：https://github.com/ngogiahan149/CAS 相關文章 PubMed DOI 推理

Exploring Inflammatory Bowel Disease Discourse on Reddit Throughout the COVID-19 Pandemic Using OpenAI's GPT-3.5 Turbo Model: Classification Model Validation and Case Study.
使用 OpenAI 的 GPT-3.5 Turbo 模型探討 COVID-19 疫情期間 Reddit 上有關 Inflammatory Bowel Disease 的討論：分類模型驗證與個案研究 J Med Internet Res 2025-07-03

這項研究用GPT-3.5分析Reddit三大IBD社群5萬多則貼文，分類情緒、主題、人口資料及是否提到COVID-19。AI分類結果和人工高度一致，貼文多討論藥物和症狀，情緒偏中性。公開年齡多為20、30歲，性別分布和一般IBD患者不同。COVID-19討論初期多，後來減少。證明AI能有效分析醫療社群資料，對未來研究很有幫助。相關文章 PubMed DOI 推理

Comparative Performance of Medical Students, ChatGPT-3.5 and ChatGPT-4.0 in Answering Questions From a Brazilian National Medical Exam: Cross-Sectional Questionnaire Study.
巴西全國醫學考試題目中，醫學生、ChatGPT-3.5 與 ChatGPT-4.0 作答表現之比較：橫斷式問卷研究 JMIR AI 2025-07-03

這項研究比較GPT-3.5和GPT-4.0在巴西醫學進階測驗的表現，發現GPT-4.0平均得分（87.2%）明顯高於GPT-3.5（68.4%），提升了27.4%。特別是在基礎醫學和婦產科領域，GPT-4.0表現更突出。這顯示AI像GPT-4.0，已經對醫學教育和評量帶來明顯影響。相關文章 PubMed DOI 推理

Medical reasoning in LLMs: an in-depth analysis of DeepSeek R1.
大型語言模型中的醫學推理：DeepSeek R1 的深入分析 Front Artif Intell 2025-07-03

這篇論文評估 DeepSeek R1 在 100 個 MedQA 臨床案例的表現，診斷準確率高達 93%，展現接近專家的醫學推理能力。常見錯誤有定勢偏誤、處理矛盾資料困難、選項有限、過度思考、知識不全及跳步。研究發現，回答越簡潔（少於 5,000 字元）準確率越高。雖然還有改進空間，DeepSeek R1 已展現協助醫療決策的潛力。相關文章 PubMed DOI 推理

Large language models in the management of chronic ocular diseases: a scoping review.
大型語言模型於慢性眼科疾病管理中的應用：一項範疇性回顧 Front Cell Dev Biol 2025-07-03

大型語言模型（LLMs）已能協助篩檢、診斷及治療慢性致盲眼疾，表現媲美專家，並提升醫療可近性。但目前仍面臨泛用性不足、演算法透明度及倫理問題、缺乏標準驗證等挑戰。未來需加強專業訓練、多元資料整合、國際驗證及倫理規範，LLMs有望成為慢性眼疾管理的重要工具。相關文章 PubMed DOI 推理

LLM 相關三個月內文章 / 第 115 頁

可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

LLM 相關三個月內文章 / 第 115 頁

可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

可選擇其它分類: 一週新進文章腎臟科一般醫學 SGLT2i GLP1