LLM 相關三個月內文章 / 第 1 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究比較 DeepSeek-R1 和 ChatGPT-4o 在口腔顎面外科問題上的表現,發現兩者整體表現差不多,DeepSeek-R1 在病人問題上稍優,ChatGPT-4o 則在部分技術問題較強。雖然兩款 AI 都有輔助諮詢的潛力,但臨床應用前還需要更多改進和研究。 相關文章 PubMed DOI 推理

這篇系統性回顧分析了機器學習模型預測小兒阻塞性水腦症接受ETV手術成功率的表現,發現和傳統工具差不多(AUC 0.63),沒有明顯進步。若有加入影像資料,表現會稍微提升(AUC 0.74)。總結來說,目前機器學習模型還沒比現有方法好,未來還需要更多研究改進。 相關文章 PubMed DOI 推理

這項研究發現,GPT-4o在回答西班牙語腸胃科專科考題時,正確率約79.6%,不論有無影像題表現都差不多。主要錯誤是治療建議太籠統、診斷或治療步驟搞混、忽略題目細節或禁忌症,常常漏看題目裡的重要資訊,影響臨床推理品質。 相關文章 PubMed DOI 推理

這項研究發現,AI 工具 Elicit 雖然能協助從文獻中提取資料,效率有時甚至比人工還高,但在複雜資訊上常常不夠完整或詳細。Elicit 可簡化系統性回顧流程,但目前還是需要人工確認,無法完全取代人工審查。 相關文章 PubMed DOI 推理

這份研究發現,孟加拉大學的師生都熟悉 ChatGPT,學生多用來學習,老師則用於備課。大家覺得它好上手,但學生較受同儕影響,老師則較願意未來持續使用。不過,大家對倫理、過度依賴和資訊正確性有疑慮,也遇到成本和語言障礙等問題。這些發現對高教政策和教學有參考價值。 相關文章 PubMed DOI 推理

我們用兩個本地 Llama 3.3:70B 模型,一個當訪談者、一個當病人,來自動產生多元又真實的心理健康訪談資料。病人設定結合預設變數和 AI 生成細節,讓內容更貼近現實。這些合成資料在詞彙和人口特徵上都很豐富,非常適合用來訓練心理健康相關的大型語言模型。 相關文章 PubMed DOI 推理

這篇系統性回顧整理2017到2025年27篇開放取用的研究,探討醫療領域應用大型語言模型時的倫理挑戰。最常被討論的是偏見與公平性,其次是安全、可靠、透明、問責和隱私。多數文獻聚焦特定臨床領域,缺乏全面性討論。本文也提出初步框架,協助未來臨床實務負責任地導入LLM。 相關文章 PubMed DOI 推理

大型語言模型能促進跨領域合作,提升溝通效率,但也可能產生錯誤資訊或偏見,因此必須謹慎使用。作者以計算生物學為例,說明在專業人員監督下,LLMs 如 ChatGPT 可成為協助工具。只要有人類負責監督,LLMs 有助加速科學發展。 相關文章 PubMed 推理

近年來,人工智慧在骨科領域的研究明顯增加,2010 到 2024 年間已有 112 篇相關論文。熱門主題包括機器學習、深度學習、ChatGPT、3D 列印和關節置換。雖然國際合作還不普及,但 AI 已逐漸改變骨科診斷與治療方式,為未來發展帶來新契機。 相關文章 PubMed DOI 推理

這項研究比較標準版和微調過的 ChatGPT-4o,在產生自體軟骨細胞植入術(ACI)病患衛教資料的表現。結果顯示,微調後的模型產生的內容品質和可讀性都更好,閱讀難度也更適合一般病患。微調能讓 AI 生成的衛教資料更適合醫師用來輔助說明,特別適用於像 ACI 這種較複雜的醫療處置。 相關文章 PubMed DOI 推理