LLM 相關三個月內文章 / 第 130 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

**重點整理:** 一個以心臟科課程為基礎訓練的大型語言模型(AI),所產生的選擇題(MCQs),在品質和難度上都跟專業心臟科醫師出的題目一樣好。受訓醫師在AI和人類專家出的題目上表現差不多,也分不出哪些題目是AI出的。這表示AI可以有效協助製作心臟科訓練用的教學教材。 相關文章 PubMed DOI 推理

一份針對527位Clare®心理健康AI用戶的調查發現,多數人因焦慮、憂鬱、壓力和孤獨選擇AI協助,主要是想避免尷尬和面對面治療的不自在。大家希望獲得情感支持和能安心表達的空間,且很快就和AI建立信任。研究指出,對話式AI能提供方便又無標籤化的心理支持,未來可再探討長期效果及與傳統治療的結合方式。 相關文章 PubMed DOI 推理

DrugReX 是一套結合知識圖譜、機器學習和大型語言模型的新系統,能更有效率地找出藥物再利用的潛力。實際應用在阿茲海默症時,不只找出新藥物候選,還能提供有文獻佐證的解釋,專家也認為這比單靠 LLMs 更可靠,有助提升藥物再利用的透明度和可信度。 相關文章 PubMed DOI 推理

這項研究用GPT-4.1分析問卷描述,找出預測吸菸者12個月內戒菸成功的關鍵因素,且不需實際問卷數據。GPT-4.1挑出的45個變項,預測效果跟用全部變項一樣好。主要影響因素有最近吸菸頻率、起床後多久抽菸、社會影響和健康考量。這顯示GPT-4.1能有效挑選重要特徵,有助未來菸害研究和介入設計。 相關文章 PubMed DOI 推理

這項研究提出「precision grounding」技術,把大型語言模型(LLM)連接到專門查詢工具CATT,利用獨特識別碼從可信資料庫抓取特定基因變異資訊。這方法讓GPT-4o在基因變異摘要上更正確、完整,也大幅減少臨床錯誤。CATT是開源工具,有助於精準醫療應用。 相關文章 PubMed DOI 推理

這項研究發現,GPT-4.0在回答創傷性腦損傷相關問題時,比GPT-3.5更可靠,但兩者在易讀性上都不如官方衛教單張。AI生成的內容雖然越來越準確,但在讓人容易看懂這方面,還有很大的進步空間。 相關文章 PubMed DOI 推理

全球實驗醫學網路研討會調查發現,參與者最需要品質管理、臨床化學、新技術、特殊檢驗、醫療領導、病例討論、公共衛生及創新等主題。這些結果可作為未來課程設計和資源規劃的參考,也有助於與IFCC合作提升全球實驗室標準。 相關文章 PubMed 推理

這項研究發現,人類專家在將護理紀錄對應到標準化分類上,表現明顯優於機器學習模型。雖然GPT-4o mini等模型在常見分類上還算可以,但遇到需要情境判斷的複雜案例就明顯落後。機器學習雖有潛力,但目前還無法完全取代專家,未來還需加強對臨床情境和專業術語的處理。 相關文章 PubMed DOI 推理

這項研究用AI和NLP技術,從牙科紀錄中自動抓出牙周病診斷資訊。團隊用GPT-4生成的資料來訓練RoBERTa模型,辨識牙周病細節的準確率高達0.97–0.98,連自由書寫的紀錄也能精準判讀。這大幅減少人工標註,且不同醫院都適用,有助於臨床資料再利用。不過,模型對語境的理解還有進步空間。 相關文章 PubMed DOI 推理

這篇論文比較人類專家和AI(ChatGPT 4.0、ChatGPT Scholar)在帕金森氏症神經功能評估文獻回顧的表現。結果發現,人類能找出24篇相關文獻,但AI工具常出現結果不完整或不一致。結論是,目前AI還無法取代人類專家做系統性文獻回顧,但未來仍有發展潛力,尤其在神經功能評估工具的應用上。 相關文章 PubMed DOI 推理