Comparing AI-assisted and traditional tactical instruction: A crossover experimental study among male college students.
AI輔助與傳統戰術指導之比較：男性大學生的交叉實驗研究 Acta Psychol (Amst) 2025-08-19

這項研究發現，利用AI（像是ChatGPT和Metrica PlayBase）輔助足球戰術教學，能讓大學生男生在戰術知識、決策力和學習滿意度上，都比傳統教練教學有更明顯的進步。結果顯示AI在運動教育上很有效，也展現出智慧戰術教學的發展潛力。相關文章 PubMed DOI 推理

A Multimodal Large Language Model as an End-to-End Classifier of Thyroid Nodule Malignancy Risk: Usability Study.
多模態大型語言模型作為甲狀腺結節惡性風險的端對端分類器：可用性研究 JMIR Form Res 2025-08-19

這項研究比較了三種多模態大型語言模型在甲狀腺超音波影像分類的表現，發現商業版 o3 準確度和一致性最好，但還是沒達到臨床標準。雖然加上影像標註和調整提示語有幫助，但提升有限。總結來說，這些 AI 工具還不夠成熟，還需要再改進才能安全用在臨床診斷上。相關文章 PubMed DOI 推理

Large Language Models Use in Dry Eye Disease: Perplexity AI versus ChatGPT4.
大型語言模型在乾眼症中的應用：Perplexity AI 與 ChatGPT4 之比較 Semin Ophthalmol 2025-08-19

ChatGPT4 和 Perplexity AI 回答乾眼症常見問題的表現差不多，整體品質中等，各方面分數也有落差。ChatGPT4 在提出研究點子上稍微優秀。這兩款 AI 也許能在門診協助病患衛教，但還是需要專家把關，且在研究點子或文獻搜尋方面都不太可靠。相關文章 PubMed DOI 推理

AI-assisted grading and personalized feedback in large political science classes: Results from randomized controlled trials.
大型政治學課程中 AI 協助評分與個別化回饋：隨機對照試驗的結果 PLoS One 2025-08-19

老師批改簡答題很花時間，常用選擇題反而限制學生思考。這項研究用大型語言模型（LLMs）協助老師批改大班簡答題，並和傳統人工批改做比較。結果發現，AI輔助批改能有效提供像小班教學一樣的個人化回饋和評分。相關文章 PubMed DOI 推理

Sparse autoencoders uncover biologically interpretable features in protein language model representations.
稀疏自動編碼器揭示蛋白質語言模型表徵中的生物學可解釋特徵 Proc Natl Acad Sci U S A 2025-08-19

這篇研究用稀疏自編碼器，從蛋白質語言模型（像ESM2）中無監督地萃取出容易理解的特徵，這些特徵和已知的生物功能、蛋白質家族高度相關，比原本模型的表徵更好解讀。這方法提升了AI在蛋白質研究的透明度和可解釋性，讓科學家更容易信任和應用這些模型。相關文章 PubMed DOI 推理

Comparing Large Language Models as Health Literacy Tools: Evaluating and Simplifying Texts on gender-Affirming Surgery.
作為健康素養工具的大型語言模型比較：評估與簡化有關性別肯認手術的文本 J Health Commun 2025-08-19

多數性別肯認手術的線上衛教資料閱讀難度太高，病患常常看不懂。研究比較了 Google Gemini、Claude 和 ChatGPT 等大型語言模型簡化這些資料的能力，發現 Gemini 表現最好，但所有模型在某些手術類型上還是會有偏差。醫療人員用這些工具時要特別小心。相關文章 PubMed DOI 推理

Human Expertise and Large Language Model Embeddings in the Content Validity Assessment of Personality Tests.
人格測驗內容效度評估中人類專家與大型語言模型嵌入的應用 Educ Psychol Meas 2025-08-19

這篇文章比較人類專家和大型語言模型（LLMs）在評估大五人格測驗題目的內容效度表現。結果發現，人類在細緻題目（BFQ）判斷較好，LLMs 則在簡單題目（BFI）表現較佳，尤其經過詞彙微調後更明顯。研究指出，結合人類與 AI 可提升心理測驗效度檢驗的效率與客觀性。相關文章 PubMed DOI 推理

Generative AI as Third Agent: Large Language Models and the Transformation of the Clinician-Patient Relationship.
生成式 AI 作為第三方：大型語言模型與醫病關係的轉變 J Particip Med 2025-08-19

這篇論文討論大型語言模型（像AI聊天機器人）如何改變醫病關係，雖然能提升病人參與和協助分流，但也有隱私、偏見和人情流失的問題。作者提出指引框架，強調醫療要保有人性，並呼籲技術人員、醫師和病人要一起合作，確保AI應用負責又透明。相關文章 PubMed DOI 推理

Spin-glass model of in-context learning.
情境學習的自旋玻璃模型 Phys Rev E 2025-08-19

這篇研究用物理學的spin glass模型來解釋簡化版transformer（用線性attention）怎麼能靠提示學新任務，不用再訓練。結果發現，預訓練時任務越多樣，模型參數就越能泛化到新提示，這給了LLM in-context learning一個具體的物理學理論依據。相關文章 PubMed DOI 推理

Transforming Cancer Nanotechnology Data Analysis and User Experience. Part I: Current Challenges and Solutions Provided by caNanoLab.
癌症奈米科技數據分析與使用者體驗的革新。第一部分：現有挑戰與 caNanoLab 所提供的解決方案 Wiley Interdiscip Rev Nanomed Nanobiotechnol 2025-08-19

癌症奈米科技雖然很有潛力，但資料分析和分享不易。caNanoLab 是重要的平台，但還需要加強即時視覺化和使用者體驗。這篇綜述整理相關計畫，以 caNanoLab 為例，討論現有挑戰、解決方法，並探討 LLM 如何改善使用者體驗，第二部分則深入分析 LLM 的應用。相關文章 PubMed DOI 推理

LLM 相關三個月內文章 / 第 13 頁

可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

LLM 相關三個月內文章 / 第 13 頁

可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

可選擇其它分類: 一週新進文章腎臟科一般醫學 SGLT2i GLP1