Evaluating AI-generated patient education materials for spinal surgeries: Comparative analysis of readability and DISCERN quality across ChatGPT and deepseek models.
評估 AI 生成的脊椎手術病患教育材料：ChatGPT 與 deepseek 模型在可讀性和 DISCERN 質量上的比較分析。 Int J Med Inform 2025-03-19

這項研究評估了四個人工智慧模型在生成脊椎手術病患教育材料的有效性，主要針對腰椎椎間盤切除術、脊椎融合術和減壓椎板切除術。結果顯示，DeepSeek-R1 的可讀性最佳，Flesch-Kincaid 分數介於 7.2 到 9.0 之間，而 ChatGPT-o3 的可讀性最低，超過 10.4。所有模型的資訊品質均低於 60，顯示出「公平」的品質，主要因缺乏參考資料。研究強調改善引用實踐及個性化 AI 生成健康資訊的必要性，未來應整合互動元素和病患反饋，以提升準確性和可及性。相關文章 PubMed DOI 推理

Enhancing text-centric fake news detection via external knowledge distillation from LLMs.
透過大型語言模型的外部知識蒸餾增強文本中心的假新聞檢測。 Neural Netw 2025-03-19

假新聞對社會構成重大威脅，因此自動檢測變得非常重要。研究發現，新聞文本內容是關鍵線索。目前的檢測方法雖然有所進步，但仍面臨挑戰，例如小型語言模型（SLM）泛化能力不足、增強外部知識的計算成本高，以及大型語言模型（LLM）常出現錯誤。為了解決這些問題，我們提出了LEKD，結合SLM、外部知識和LLM的優勢，並透過圖的語義感知特徵對齊模組來解決知識矛盾。實驗結果顯示，LEKD的表現超越現有基準。相關文章 PubMed DOI 推理

Improving Dietary Supplement Information Retrieval: Development of a Retrieval-Augmented Generation System With Large Language Models.
改善膳食補充劑資訊檢索：基於大型語言模型的檢索增強生成系統的開發。 J Med Internet Res 2025-03-19

這項研究專注於利用先進的檢索增強生成（RAG）系統，結合更新版的膳食補充品知識庫2.0（iDISK2.0），提升膳食補充品資訊的準確性。iDISK2.0整合可信來源的數據並進行清理，提升質量。RAG系統結合生物醫學知識圖譜與大型語言模型，能提供準確的證據回應，解決獨立LLMs的錯誤資訊問題。評估結果顯示，準確率達99%和95%，顯著優於獨立LLMs。未來將擴展至其他生物醫學領域，並透過真實查詢增強評估。相關文章 PubMed DOI 推理

Large Language Models for Pediatric Differential Diagnoses in Rural Health Care: Multicenter Retrospective Cohort Study Comparing GPT-3 With Pediatrician Performance.
大型語言模型在鄉村醫療中對兒科鑑別診斷的應用：多中心回顧性隊列研究比較 GPT-3 與兒科醫生的表現。 JMIRx Med 2025-03-19

這項研究探討了一個微調過的GPT-3模型在農村醫療環境中對兒科病例診斷的有效性，因為這些地區專家資源有限。研究分析了路易斯安那州中部的500個兒科就診案例，發現模型準確率達87.3%，敏感度和特異度分別為85%和90%，與兒科醫生的91.3%相當。模型在不同年齡組和常見病症中表現穩定，但對罕見診斷的準確率稍低。總體來說，這個微調的GPT-3模型可作為農村兒科護理的可靠診斷工具，但仍需在不同人群中進一步驗證。相關文章 PubMed DOI 推理

Protocol for human evaluation of generative artificial intelligence chatbots in clinical consultations.
臨床諮詢中生成式人工智慧聊天機器人之人類評估方案。 PLoS One 2025-03-19

生成式人工智慧（GenAI）在醫療服務中有潛力，尤其是在臨床環境。不過，實際臨床的複雜性需要謹慎且基於證據的方法來確保AI的安全與有效性。本研究將系統性評估四個知名的GenAI模型（Claude 2、Gemini Pro、GPT-4.0及一個自訂的GPT-4.0聊天機器人），並針對臨床微生物學和傳染病領域進行分析。評估將由兩組專業醫師進行，使用5點李克特量表來檢視回應的事實一致性、全面性、一致性及潛在醫療危害。研究將提供GenAI在臨床應用的見解，並強調制定倫理指導方針的重要性。相關文章 PubMed DOI 推理

Synthetic Data-Driven Approaches for Chinese Medical Abstract Sentence Classification: Computational Study.
基於合成數據驅動的中文醫學摘要句子分類方法：計算研究。 JMIR Form Res 2025-03-19

這項研究針對分類中文醫學摘要的挑戰，對改善醫學資料庫的搜尋和文獻回顧非常重要。由於缺乏合適的數據集，我們生成了三個訓練數據集和一個測試數據集，以提升分類準確性。數據集 #1 來自 PubMed 的 15,000 條翻譯摘要，數據集 #2 和 #3 則是從 40,000 條中文醫學摘要中生成的。透過 SBERT 嵌入進行語義分析，我們的模型在分類效果上顯著提升，SBERT-DocSCAN 在數據集 #3 上達到最高準確率 91.30%。這項研究不僅生成了有價值的數據集，還證明了模型的有效性。相關文章 PubMed DOI 推理

Using ChatGPT to Improve the Presentation of Plain Language Summaries of Cochrane Systematic Reviews About Oncology Interventions: Cross-Sectional Study.
使用 ChatGPT 改善關於腫瘤學介入的 Cochrane 系統評價的簡明語言摘要的呈現：橫斷面研究。 JMIR Cancer 2025-03-19

簡明語言摘要（PLS）對於讓大眾理解醫療資訊，特別是在腫瘤學中，至關重要。研究探討大型語言模型如ChatGPT是否能簡化PLS而不改變原始結論。研究使用275篇科學摘要，發現ChatGPT生成的PLS在可讀性和情感參與度上表現更佳，字數也較少。第一個提示生成的PLS最短且易讀，SMOG分數顯著低於原始PLS。總體而言，ChatGPT能有效簡化PLS，使醫療資訊更易於大眾理解，但仍需進一步研究以確保資訊的準確性。相關文章 PubMed DOI 推理

Performance of ChatGPT-4 on Taiwanese Traditional Chinese Medicine Licensing Examinations: Cross-Sectional Study.
ChatGPT-4 在台灣傳統中醫執照考試中的表現：橫斷面研究。 JMIR Med Educ 2025-03-19

本研究探討了ChatGPT（特別是GPT-4模型）在台灣傳統中醫執照考試中的表現。測試結果顯示，ChatGPT的準確率僅43.9%，遠低於兩位持證中醫師的70%和78.4%。大部分錯誤來自對中醫概念的誤解，顯示其在中醫知識和推理上的局限性。雖然ChatGPT在教育資源方面有潛力，但目前在TCM考試中的表現仍不理想。研究建議需改進專門的中醫AI模型，並對其在中醫教育中的應用保持謹慎，未來應專注於提升模型及開發專屬的學習工具。相關文章 PubMed DOI 推理

[The use of large language models in medicine and in radiology in particular].
「大型語言模型在醫學中的應用，特別是在放射學中的應用。」 Radiologie (Heidelb) 2025-03-19

將大型語言模型（LLMs）如Claude AI整合進放射學，為報告增強、工作流程優化及臨床決策提供了新機會。Claude在生成結構化內容和識別放射學應用方面表現出色，但使用時需謹慎，因其效果依賴於使用者的批判性評估能力。解決與LLMs相關的倫理和實際挑戰，對維持技術與醫療專業人員的自主性至關重要。隨著生成式AI的發展，謹慎實施將有助於最大化臨床利益並降低風險，確保放射學的安全與有效使用。相關文章 PubMed DOI 推理

A tutorial activity for students to experience generative artificial intelligence: students' perceptions and actions.
學生體驗生成性人工智慧的教學活動：學生的感知與行動。 Adv Physiol Educ 2025-03-19

這項研究探討生成性人工智慧（GenAI）在生理學教育中的應用，特別是對學習和學術誠信的影響。活動持續兩年，236名二年級生理學學生參與，並批評由ChatGPT生成的考試範例答案，指出其缺乏深度和準確性。學生們在Padlet上分享了492則貼文，顯示對GenAI的接受度逐漸提高，但也對學術誠信和學習影響表示擔憂。最後揭示該範例是AI生成，強調負責任使用GenAI的重要性，突顯其在學術環境中的潛在好處與風險。相關文章 PubMed DOI 推理

LLM 相關三個月內文章 / 第 56 頁

可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

LLM 相關三個月內文章 / 第 56 頁

可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

可選擇其它分類: 一週新進文章腎臟科一般醫學 SGLT2i GLP1