Sparse autoencoders uncover biologically interpretable features in protein language model representations.
稀疏自動編碼器揭示蛋白質語言模型表徵中的生物學可解釋特徵 Proc Natl Acad Sci U S A 2025-08-19

這篇研究用稀疏自編碼器，從蛋白質語言模型（像ESM2）中無監督地萃取出容易理解的特徵，這些特徵和已知的生物功能、蛋白質家族高度相關，比原本模型的表徵更好解讀。這方法提升了AI在蛋白質研究的透明度和可解釋性，讓科學家更容易信任和應用這些模型。相關文章 PubMed DOI 推理

Comparing Large Language Models as Health Literacy Tools: Evaluating and Simplifying Texts on gender-Affirming Surgery.
作為健康素養工具的大型語言模型比較：評估與簡化有關性別肯認手術的文本 J Health Commun 2025-08-19

多數性別肯認手術的線上衛教資料閱讀難度太高，病患常常看不懂。研究比較了 Google Gemini、Claude 和 ChatGPT 等大型語言模型簡化這些資料的能力，發現 Gemini 表現最好，但所有模型在某些手術類型上還是會有偏差。醫療人員用這些工具時要特別小心。相關文章 PubMed DOI 推理

Human Expertise and Large Language Model Embeddings in the Content Validity Assessment of Personality Tests.
人格測驗內容效度評估中人類專家與大型語言模型嵌入的應用 Educ Psychol Meas 2025-08-19

這篇文章比較人類專家和大型語言模型（LLMs）在評估大五人格測驗題目的內容效度表現。結果發現，人類在細緻題目（BFQ）判斷較好，LLMs 則在簡單題目（BFI）表現較佳，尤其經過詞彙微調後更明顯。研究指出，結合人類與 AI 可提升心理測驗效度檢驗的效率與客觀性。相關文章 PubMed DOI 推理

Generative AI as Third Agent: Large Language Models and the Transformation of the Clinician-Patient Relationship.
生成式 AI 作為第三方：大型語言模型與醫病關係的轉變 J Particip Med 2025-08-19

這篇論文討論大型語言模型（像AI聊天機器人）如何改變醫病關係，雖然能提升病人參與和協助分流，但也有隱私、偏見和人情流失的問題。作者提出指引框架，強調醫療要保有人性，並呼籲技術人員、醫師和病人要一起合作，確保AI應用負責又透明。相關文章 PubMed DOI 推理

Spin-glass model of in-context learning.
情境學習的自旋玻璃模型 Phys Rev E 2025-08-19

這篇研究用物理學的spin glass模型來解釋簡化版transformer（用線性attention）怎麼能靠提示學新任務，不用再訓練。結果發現，預訓練時任務越多樣，模型參數就越能泛化到新提示，這給了LLM in-context learning一個具體的物理學理論依據。相關文章 PubMed DOI 推理

Transforming Cancer Nanotechnology Data Analysis and User Experience. Part I: Current Challenges and Solutions Provided by caNanoLab.
癌症奈米科技數據分析與使用者體驗的革新。第一部分：現有挑戰與 caNanoLab 所提供的解決方案 Wiley Interdiscip Rev Nanomed Nanobiotechnol 2025-08-19

癌症奈米科技雖然很有潛力，但資料分析和分享不易。caNanoLab 是重要的平台，但還需要加強即時視覺化和使用者體驗。這篇綜述整理相關計畫，以 caNanoLab 為例，討論現有挑戰、解決方法，並探討 LLM 如何改善使用者體驗，第二部分則深入分析 LLM 的應用。相關文章 PubMed DOI 推理

Beyond the surface of capacity building: a mixed-methods study of the core functions and forms of dissemination and implementation science consultations.
超越能力建構的表面：一項關於推廣與執行科學諮詢核心功能與形式的混合方法研究 Implement Sci Commun 2025-08-19

這項研究分析了加州大學聖地牙哥分校三個DIS能力建構計畫的108場諮詢會議，發現多數諮詢聚焦在計畫申請、專案執行及DIS原則應用，指導內容多為中階技能。研究建議，應提供分級訓練、強化追蹤機制，並採用可擴展的諮詢模式，以更有效提升DIS能力。相關文章 PubMed DOI 推理

CAP: The creativity assessment platform for online testing and automated scoring.
CAP：用於線上測驗與自動評分的創造力評估平台 Behav Res Methods 2025-08-18

Creativity Assessment Platform（CAP）是一個免費又好上手的網頁工具，支援十種語言，完全不用寫程式。它用機器學習自動評分創造力測驗，還有多種任務可選，能幫忙產生研究方法內容，讓教育和研究人員更方便做創造力評量，也更容易重現結果。相關文章 PubMed DOI 推理

Improving automated deep phenotyping through large language models using retrieval-augmented generation.
利用檢索增強生成（retrieval-augmented generation）的大型語言模型提升自動化深度表現型分析。 Genome Med 2025-08-18

RAG-HPO 是一款開源 Python 工具，運用 RAG 技術和大型語言模型，能從臨床文本中精準擷取 HPO 術語。它結合 LLM 和龐大詞彙庫，效能明顯優於現有工具，能減少誤判和幻覺，對罕見遺傳疾病的診斷和研究很有幫助。工具可在 GitHub 下載。相關文章 PubMed DOI 推理

A systematic evaluation of Dutch large language models' surprisal estimates in sentence, paragraph and book reading.
荷蘭大型語言模型在句子、段落及書籍閱讀中驚訝值估計的系統性評估 Behav Res Methods 2025-08-18

這篇研究比較多種荷蘭語和多語言的大型語言模型，用「驚訝值」來預測人類閱讀時間。結果發現，GPT-2表現最好，但有時小型模型反而更貼近閱讀數據，這和英文研究結果相同。研究也證實驚訝值和閱讀時間呈線性關係，但不同語料庫結果會有差異。研究公開了所有數據和程式碼，並指出沒有單一模型能適用所有心理語言學研究。相關文章 PubMed DOI 推理

LLM 相關三個月內文章 / 第 21 頁

可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

LLM 相關三個月內文章 / 第 21 頁

可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

可選擇其它分類: 一週新進文章腎臟科一般醫學 SGLT2i GLP1