Surgeon, Trainee, or GPT? A Blinded Multicentric Study of AI-Augmented Operative Notes.
外科醫師、受訓醫師，還是 GPT？一項關於 AI 輔助手術紀錄的多中心盲性研究 Laryngoscope 2025-08-20

這項研究發現，主治醫師結合GPT協助撰寫的手術紀錄，品質和認可度最高；單獨用GPT雖然最快，但正確性較差。AI輔助能加快撰寫速度，結合專業醫師與GPT能產生最佳手術紀錄，提升效率與一致性。相關文章 PubMed DOI 推理

Mapping Key Nodes and Global Trends in AI and Large Language Models for Medical Education: A Bibliometric Study.
醫學教育中人工智慧與大型語言模型的關鍵節點與全球趨勢圖譜分析：一項文獻計量學研究 Adv Med Educ Pract 2025-08-20

AI和大型語言模型正快速影響醫學教育，相關研究數量大增。美國、英國、中國是主要貢獻國，JMIR Medical Education等期刊領先。現有研究多聚焦ChatGPT、護理教育、醫學考試和倫理，但臨床推理、大學部教育、虛擬實境等還有待深入。整體來說，這領域還在發展，未來研究空間很大。相關文章 PubMed DOI 推理

Analyses of different prescriptions for health using artificial intelligence: a critical approach based on the international guidelines of health institutions.
運用人工智慧分析不同健康處方：基於國際衛生機構指引的批判性探討 Health Inf Sci Syst 2025-08-20

這項研究比較 ChatGPT 4.0、4.5 和 DeepSeek V3 在四種醫療情境下依臨床指引給建議的能力。ChatGPT 4.5 表現最好（61.9%符合指引），心理健康領域分數高於營養領域。醫師式提問通常能提升分數，但營養領域例外。研究也提出新的評分系統，發現 LLM 雖能快速產生符合指引的照護計畫，但內容偏通用，缺乏個人化。相關文章 PubMed DOI 推理

Detecting Stigmatizing Language in Clinical Notes with Large Language Models for Addiction Care.
利用大型語言模型偵測成癮照護臨床紀錄中的污名化語言 medRxiv 2025-08-20

這項研究發現，經過監督式微調的Llama-3大型語言模型，在偵測ICU病歷中對物質使用障礙患者的污名化語言上，準確率超過97%，甚至比人工標註還細膩。這些模型不只準確，還能說明判斷依據，未來有助於提升臨床文件的用語品質，減少污名化現象。相關文章 PubMed DOI 推理

Scoring Physician Risk Communication in Prostate Cancer Using Large Language Models.
使用大型語言模型評分醫師在前列腺癌風險溝通中的表現 medRxiv 2025-08-20

這項研究開發出一套用大型語言模型（像GPT-4o）自動評分醫師在前列腺癌諮詢時，溝通風險和權衡的表現。結果顯示，這方法評分準確度高（F1分數85–92），和人工標註差不多，還比傳統模型好。這技術未來可用來提升醫病溝通品質，對癌症照護和其他醫療領域都很有幫助。相關文章 PubMed DOI 推理

Large Language Models for Psychiatric Phenotype Extraction from Electronic Health Records.
用於從電子健康紀錄中萃取精神疾病表現型的大型語言模型 medRxiv 2025-08-20

這項研究發現，開源大型語言模型（LLMs）如果沒經過微調，偵測西班牙文臨床紀錄中的精神科症狀表現很差，但經過微調後，準確度大幅提升，甚至比傳統NLP方法更好。團隊還建立了保障隱私的合成資料集，並推出高準確率的「Mistral-small-psych」模型，泛用性也不錯。這證明針對醫療任務微調LLMs很重要，對西班牙語精神科研究很有幫助。相關文章 PubMed DOI 推理

Evaluating scientific theories as predictive models in language neuroscience.
在語言神經科學中評估科學理論作為預測模型 bioRxiv 2025-08-20

作者提出用問答編碼模型，讓大型語言模型回答理論設計的是非題，產生可解釋特徵來預測大腦反應。這方法在fMRI和ECoG資料上表現比現有模型好，產生的大腦地圖也符合過去研究，顯示LLM能有效連結理論與神經科學數據模型。相關文章 PubMed DOI 推理

GraphCheck: Breaking Long-Term Text Barriers with Extracted Knowledge Graph-Powered Fact-Checking.
GraphCheck：以萃取式知識圖譜驅動事實查核，突破長篇文本的障礙 Proc Conf Assoc Comput Linguist Meet 2025-08-20

GraphCheck 是一套新型事實查核工具，結合知識圖譜和圖神經網路，能有效處理長篇、多層次關聯的內容。這讓大型語言模型在查核專業領域（如醫學）時更準確又省資源。實驗證明，GraphCheck 表現比現有方法更好，且用更少資源就能達到頂尖準確率。相關文章 PubMed DOI 推理

Multiagent AI Systems in Health Care: Envisioning Next-Generation Intelligence.
醫療照護中的多代理人AI系統：展望次世代智慧 Fed Pract 2025-08-20

醫療照護擴展困難，主因是人力、成本和法規限制。多代理人AI系統（多個AI協作）有望突破現有瓶頸，改善病患照護、行政流程和臨床決策。文章以敗血症管理為例，說明AI分工合作的應用，也提到慢性病和醫院流程優化。技術挑戰包括資料整合、品質控管和倫理問題。未來發展需重視驗證、監督和以病患為中心的設計。相關文章 PubMed DOI 推理

Small, open-source text-embedding models as substitutes to OpenAI models for gene analysis.
可作為基因分析替代 OpenAI 模型的小型開源文本嵌入模型 Comput Struct Biotechnol J 2025-08-20

GenePT 用 OpenAI 的 text-embedding 技術來分析基因表現，但有隱私疑慮。研究發現，Hugging Face 上的十款小型開源 transformer 模型，有些在基因分類任務上表現甚至比 OpenAI 更好，且更重視隱私。微調這些模型通常效果有限。相關文章 PubMed DOI 推理

LLM 相關三個月內文章 / 第 18 頁

可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

LLM 相關三個月內文章 / 第 18 頁

可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

可選擇其它分類: 一週新進文章腎臟科一般醫學 SGLT2i GLP1