Comparative study of technical and patient-related question answering quality of DeepSeek-R1 and ChatGPT-4o in the field of oral and maxillofacial surgery.
口腔與顎面外科領域中 DeepSeek-R1 與 ChatGPT-4o 在技術性與病患相關問題回答品質的比較研究 Oral Maxillofac Surg 2025-09-29

這項研究比較 DeepSeek-R1 和 ChatGPT-4o 在口腔顎面外科問題上的表現，發現兩者整體表現差不多，DeepSeek-R1 在病人問題上稍優，ChatGPT-4o 則在部分技術問題較強。雖然兩款 AI 都有輔助諮詢的潛力，但臨床應用前還需要更多改進和研究。相關文章 PubMed DOI 推理

Machine learning for endoscopic third ventriculostomy success prediction-a systematic review and meta-analysis.
內視鏡第三腦室造口術成功預測的機器學習應用——系統性回顧與統合分析 Childs Nerv Syst 2025-09-29

這篇系統性回顧分析了機器學習模型預測小兒阻塞性水腦症接受ETV手術成功率的表現，發現和傳統工具差不多（AUC 0.63），沒有明顯進步。若有加入影像資料，表現會稍微提升（AUC 0.74）。總結來說，目前機器學習模型還沒比現有方法好，未來還需要更多研究改進。相關文章 PubMed DOI 推理

Evaluation of the clinical reasoning of GPT-4o, a multimodal generative artificial intelligence model, in 18 public gastroenterology case studies.
GPT-4o 這一多模態生成式人工智慧模型在 18 篇公開腸胃科病例研究中的臨床推理評估 Rev Esp Enferm Dig 2025-09-29

這項研究發現，GPT-4o在回答西班牙語腸胃科專科考題時，正確率約79.6%，不論有無影像題表現都差不多。主要錯誤是治療建議太籠統、診斷或治療步驟搞混、忽略題目細節或禁忌症，常常漏看題目裡的重要資訊，影響臨床推理品質。相關文章 PubMed DOI 推理

Data Extractions Using a Large Language Model (Elicit) and Human Reviewers in Randomized Controlled Trials: A Systematic Comparison.
隨機對照試驗中使用大型語言模型（Elicit）與人工審查者進行資料擷取的系統性比較 Cochrane Evid Synth Methods 2025-09-29

這項研究發現，AI 工具 Elicit 雖然能協助從文獻中提取資料，效率有時甚至比人工還高，但在複雜資訊上常常不夠完整或詳細。Elicit 可簡化系統性回顧流程，但目前還是需要人工確認，無法完全取代人工審查。相關文章 PubMed DOI 推理

Teachers' and students' use of ChatGPT at Social science faculty in the public and private Universities of Bangladesh.
孟加拉公私立大學社會科學院師生對 ChatGPT 的使用情形 F1000Res 2025-09-29

這份研究發現，孟加拉大學的師生都熟悉 ChatGPT，學生多用來學習，老師則用於備課。大家覺得它好上手，但學生較受同儕影響，老師則較願意未來持續使用。不過，大家對倫理、過度依賴和資訊正確性有疑慮，也遇到成本和語言障礙等問題。這些發現對高教政策和教學有參考價值。相關文章 PubMed DOI 推理

Synthetic patient and interview transcript creator: an essential tool for LLMs in mental health.
合成病患與訪談逐字稿產生器：精神健康領域大型語言模型（LLMs）的重要工具 Front Digit Health 2025-09-29

我們用兩個本地 Llama 3.3:70B 模型，一個當訪談者、一個當病人，來自動產生多元又真實的心理健康訪談資料。病人設定結合預設變數和 AI 生成細節，讓內容更貼近現實。這些合成資料在詞彙和人口特徵上都很豐富，非常適合用來訓練心理健康相關的大型語言模型。相關文章 PubMed DOI 推理

A systematic review of ethical considerations of large language models in healthcare and medicine.
醫療與醫學中大型語言模型倫理考量的系統性回顧 Front Digit Health 2025-09-29

這篇系統性回顧整理2017到2025年27篇開放取用的研究，探討醫療領域應用大型語言模型時的倫理挑戰。最常被討論的是偏見與公平性，其次是安全、可靠、透明、問責和隱私。多數文獻聚焦特定臨床領域，缺乏全面性討論。本文也提出初步框架，協助未來臨床實務負責任地導入LLM。相關文章 PubMed DOI 推理

Roadmap for using large language models (LLMs) to accelerate cross-disciplinary research with an example from computational biology.
加速跨學科研究之大型語言模型（LLMs）應用藍圖：以計算生物學為例 ArXiv 2025-09-29

大型語言模型能促進跨領域合作，提升溝通效率，但也可能產生錯誤資訊或偏見，因此必須謹慎使用。作者以計算生物學為例，說明在專業人員監督下，LLMs 如 ChatGPT 可成為協助工具。只要有人類負責監督，LLMs 有助加速科學發展。相關文章 PubMed 推理

The Rise of Artificial Intelligence in Orthopedics: A Bibliometric and Visualization Analysis.
骨科領域人工智慧的崛起：文獻計量與視覺化分析 J Multidiscip Healthc 2025-09-29

近年來，人工智慧在骨科領域的研究明顯增加，2010 到 2024 年間已有 112 篇相關論文。熱門主題包括機器學習、深度學習、ChatGPT、3D 列印和關節置換。雖然國際合作還不普及，但 AI 已逐漸改變骨科診斷與治療方式，為未來發展帶來新契機。相關文章 PubMed DOI 推理

Refining patient education on autologous chondrocyte implantation for chondral lesions of the knee: A fine-tuned ChatGPT-4o model improves readability and quality.
優化膝關節軟骨損傷自體軟骨細胞移植患者衛教：經微調的 ChatGPT-4o 模型提升可讀性與品質 J Exp Orthop 2025-09-29

這項研究比較標準版和微調過的 ChatGPT-4o，在產生自體軟骨細胞植入術（ACI）病患衛教資料的表現。結果顯示，微調後的模型產生的內容品質和可讀性都更好，閱讀難度也更適合一般病患。微調能讓 AI 生成的衛教資料更適合醫師用來輔助說明，特別適用於像 ACI 這種較複雜的醫療處置。相關文章 PubMed DOI 推理

LLM 相關三個月內文章 / 第 1 頁

可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

LLM 相關三個月內文章 / 第 1 頁

可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

可選擇其它分類: 一週新進文章腎臟科一般醫學 SGLT2i GLP1