Digital twins as self-models for intelligent structures.
作為智慧結構自我模型的數位分身 Sci Rep 2025-08-19

這篇論文提出一套專為小型建築設計的代理人式數位分身架構，每個組件由代理人管理，系統會持續自我更新並用知識圖譜編碼。數位分身能執行工作流程、與人協作，並結合知識圖譜與大型語言模型，用檢索增強生成技術回答自然語言問題。論文定義四種操作模式，展示五個代理人的離線應用，使用者可透過網頁介面互動與視覺化模型。相關文章 PubMed DOI 推理

Specialized curricula for training vision language models in retinal image analysis.
視網膜影像分析中訓練視覺語言模型的專業課程設計 NPJ Digit Med 2025-08-19

現有像ChatGPT-4o這類AI模型，在診斷老年性黃斑部病變時，表現還是比不上眼科醫師。不過，研究團隊透過專門設計的訓練課程，開發出RetinaVLM-Specialist，讓它在分期和轉診上表現已經追上資淺醫師，甚至比其他AI更準確。專家也認同這種課程式訓練，能讓AI更貼近臨床需求。相關文章 PubMed DOI 推理

"My AI is Lying to Me": User-reported LLM hallucinations in AI mobile apps reviews.
「我的AI在對我說謊」：使用者回報於AI行動應用程式評論中的LLM幻覺現象 Sci Rep 2025-08-19

這篇論文分析300萬則AI應用程式用戶評論，發現約1.75%提到LLM幻覺，最常見是事實性錯誤。作者建立七種幻覺分類，並指出用戶回報這些錯誤時有特定語言和情緒特徵。研究建議，行動App應加強LLM錯誤監控和修正，提升用戶信任與軟體品質。相關文章 PubMed DOI 推理

Citation integrity in the age of AI: evaluating the risks of reference hallucination in maxillofacial literature.
AI時代的引用誠信：評估口腔顎面文獻中參考文獻幻覺的風險 J Craniomaxillofac Surg 2025-08-19

在學術寫作用 ChatGPT 這類 AI 時，常會遇到「參考文獻幻覺」問題，也就是 AI 會捏造或給錯引用，這對學術誠信很傷，特別是在重視實證的口腔顎面外科領域。建議加強編輯把關、提升 AI 素養，並用即時引用工具，確保文獻正確，維護學術公信力。相關文章 PubMed DOI 推理

Assessing the transferability of BERT to patient safety: classifying multiple types of incident reports.
BERT於病人安全領域的可轉移性評估：多類型事件報告的分類 BMJ Health Care Inform 2025-08-19

這項研究發現，微調過的BERT模型在分類病人安全事件報告時，比傳統CNN模型更能準確辨識罕見事件和嚴重程度，且在新資料上也有不錯表現。即使資料量少或分布不均，BERT只用預設參數就能有很好的效果，顯示其在醫療文本分類上相當有潛力。相關文章 PubMed DOI 推理

Artificial intelligence in endometriosis care: A comparative analysis of large language model and human specialist responses to endometriosis-related queries.
人工智慧於子宮內膜異位症照護中的應用：大型語言模型與人類專科醫師對子宮內膜異位症相關問題回應的比較分析 Eur J Obstet Gynecol Reprod Biol 2025-08-19

這項研究發現，ChatGPT-4o 回答子宮內膜異位症相關問題的表現，和人類專家差不多，品質、正確性和安全性都不輸專家。雖然專家多能分辨 AI 回答，但 AI 仍有潛力協助病人獲取健康資訊。未來還需進一步研究 AI 在臨床應用的風險與接受度。相關文章 PubMed DOI 推理

Comparing AI-assisted and traditional tactical instruction: A crossover experimental study among male college students.
AI輔助與傳統戰術指導之比較：男性大學生的交叉實驗研究 Acta Psychol (Amst) 2025-08-19

這項研究發現，利用AI（像是ChatGPT和Metrica PlayBase）輔助足球戰術教學，能讓大學生男生在戰術知識、決策力和學習滿意度上，都比傳統教練教學有更明顯的進步。結果顯示AI在運動教育上很有效，也展現出智慧戰術教學的發展潛力。相關文章 PubMed DOI 推理

A Multimodal Large Language Model as an End-to-End Classifier of Thyroid Nodule Malignancy Risk: Usability Study.
多模態大型語言模型作為甲狀腺結節惡性風險的端對端分類器：可用性研究 JMIR Form Res 2025-08-19

這項研究比較了三種多模態大型語言模型在甲狀腺超音波影像分類的表現，發現商業版 o3 準確度和一致性最好，但還是沒達到臨床標準。雖然加上影像標註和調整提示語有幫助，但提升有限。總結來說，這些 AI 工具還不夠成熟，還需要再改進才能安全用在臨床診斷上。相關文章 PubMed DOI 推理

Large Language Models Use in Dry Eye Disease: Perplexity AI versus ChatGPT4.
大型語言模型在乾眼症中的應用：Perplexity AI 與 ChatGPT4 之比較 Semin Ophthalmol 2025-08-19

ChatGPT4 和 Perplexity AI 回答乾眼症常見問題的表現差不多，整體品質中等，各方面分數也有落差。ChatGPT4 在提出研究點子上稍微優秀。這兩款 AI 也許能在門診協助病患衛教，但還是需要專家把關，且在研究點子或文獻搜尋方面都不太可靠。相關文章 PubMed DOI 推理

AI-assisted grading and personalized feedback in large political science classes: Results from randomized controlled trials.
大型政治學課程中 AI 協助評分與個別化回饋：隨機對照試驗的結果 PLoS One 2025-08-19

老師批改簡答題很花時間，常用選擇題反而限制學生思考。這項研究用大型語言模型（LLMs）協助老師批改大班簡答題，並和傳統人工批改做比較。結果發現，AI輔助批改能有效提供像小班教學一樣的個人化回饋和評分。相關文章 PubMed DOI 推理

LLM 相關三個月內文章 / 第 20 頁

可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

LLM 相關三個月內文章 / 第 20 頁

可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

可選擇其它分類: 一週新進文章腎臟科一般醫學 SGLT2i GLP1