LLM 相關三個月內文章 / 第 129 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

AI 正在改變骨科手術,不只提升影像判讀和手術精準度,也幫助醫師處理病歷、衛教和決策。研究發現,AI 輔助手術更精確有效,但導入前需嚴格驗證並整合到醫療流程。AI 是輔助醫師,讓醫療更安全、個人化和公平,同時保留醫師的專業判斷。 相關文章 PubMed DOI 推理

這項研究比較了三款大型語言模型(ChatGPT-4、Copilot、Gemini)回答梨狀肌症候群相關問題的表現。結果發現,ChatGPT 和 Gemini 的答案比 Copilot 更完整、品質也較好,但三者在正確性上差不多。整體來說,這些AI有潛力協助健康諮詢,但還需要再加強,才能讓資訊更正確、完整又好懂。 相關文章 PubMed DOI 推理

這項研究發現,ScholarGPT 在牙髓根尖手術問題的答題正確率最高,達97.7%,優於 ChatGPT-4o(90.1%)和 Google Gemini(59.5%)。主要原因是 ScholarGPT 有用學術資料庫,答案更精確。結果顯示,專為學術領域訓練的 GPT 模型在牙科主題上較可靠,但仍需更多研究來開發專門的牙髓病學模型。 相關文章 PubMed DOI 推理

這份研究發現,約旦醫學教育界願意用ChatGPT,主要是因為覺得它實用又好操作。雖然大家會擔心錯誤資訊或隱私問題,但這些顧慮並不會真的影響使用意願。外部支援影響不大。想推廣ChatGPT,重點應放在提升信任感和解決錯誤資訊,因為實用性和易用性才是大家最在意的。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT-3.5在診斷和建議治療複雜低鈉血症案例時,表現還是不如臨床醫師,且診斷和建議常有不足。雖然2024年版本有些微進步,甚至在部分案例中比多數醫師更能發現罕見疾病,但整體來說,免費版ChatGPT-3.5在這類困難醫療問題上還不夠可靠,建議民眾參考時要特別謹慎。 相關文章 PubMed DOI 推理

這篇論文提出HybridRAG飛機故障診斷框架,結合知識圖譜和大型語言模型,利用多種檢索技術(圖譜推理、向量搜尋、BM25),能從不同資料來源取得資訊。這方法提升診斷準確度,F1分數比傳統高4%,幻覺率低7%。同時內建智慧助理,能互動協助維修人員排除故障,讓診斷更聰明、更有效率。 相關文章 PubMed DOI 推理

這項研究用 Llama 3.0 大型語言模型分析兩家醫院的病歷,來偵測手術部位感染。28位病人中,LLM準確率達93%,敏感度100%,特異度86%。模型多半能和醫師一樣早,甚至更早發現感染。結果顯示 LLM 有潛力協助醫療篩檢,但臨床應用前還需更多研究驗證。 相關文章 PubMed DOI 推理

這項研究比較ChatGPT-Omni和Gemini兩款AI在500題神經外科案例題的表現。結果顯示,ChatGPT-Omni在準確性、相關性和清晰度上都比Gemini好,不論初次還是後續評估都領先。雖然兩者都有進步,但ChatGPT-Omni在所有神經外科情境下表現都較佳,更適合用於臨床決策和教育輔助。 相關文章 PubMed DOI 推理

這項研究比較六種AI語言模型設計5歲兒童語言治療計畫的表現,發現AI產出的計畫品質從「需要改進」到「符合預期」都有。使用更結構化的提示能提升結果,但提供更多個案細節未必有幫助。每種AI工具各有優缺點,這些發現可作為語言治療師和教育人員負責任使用AI的參考。 相關文章 PubMed DOI 推理

這項研究發現,南韓民眾在網路上搜尋像「腸胃不適」或「水狀腹瀉」這類常用詞時,和急診因腹瀉就診人數有明顯關聯,甚至能提前兩週預測急診潮,特別是在50歲以下族群。這表示,透過監測網路搜尋趨勢,有助於提早掌握腹瀉疫情,提升公衛監測效率。 相關文章 PubMed DOI 推理