LLM 相關三個月內文章 / 第 33 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究用AI(像GPT-4o)和機器學習,快速從超過1億1千7百萬種分子中,找到662種能穩定黑磷(BP)的分子,並經模擬和實驗驗證。這不只加速了材料開發,還提出新分子設計策略,讓連親水性分子都能保護BP,展現AI在材料工程上的強大潛力。 相關文章 PubMed DOI 推理

這項研究提出GAIDeT框架,讓研究人員能清楚、標準化地記錄AI在各研究階段的參與情形,包括AI角色、人類監督程度及各研究環節。還有互動工具協助申報,目的是提升AI使用的透明度與誠信。未來還需針對驗證和政策進行進一步研究。 相關文章 PubMed DOI 推理

這項研究比較三款AI聊天機器人和資深外科醫師在網路植髮諮詢的表現,發現AI在正確性、同理心、易懂性等方面表現不輸醫師,甚至更好。以Gemini Advanced表現最優。不過,臨床應用前還要解決隱私和倫理等問題。 相關文章 PubMed DOI 推理

作者強調,政治學和社會科學研究人員在用大型語言模型(LLMs)時,應該把科學推論放在第一位。這樣才能有效累積相關知識。文中也討論用LLMs做推論時的挑戰和機會,並以模型輸出驗證為例,說明如何判斷LLMs在特定任務上的表現,以及根據結果提出推論建議。 相關文章 PubMed DOI 推理

「MathOdyssey」是一套全新、由專家整理的數學題庫,收錄387題高中到奧林匹亞等級的挑戰題,附詳細解答。這資料集專為測試大型語言模型的數學推理能力設計,內容標準化且經同儕審查。作者也公開評估多個LLM的表現,並釋出資料集,促進數學AI研究發展。 相關文章 PubMed DOI 推理

這項研究比較三款大型語言模型在小兒外科考試的表現,結果 DeepSeek(2025年版)正確率高達85%,明顯勝過 Copilot(55.4%)、Bard(48%)和人類受訓醫師(60.1%)。顯示新一代 AI 進步很快,但臨床應用前還是要持續評估安全性與可靠性。 相關文章 PubMed DOI 推理

這項研究比較GPT-4和DeepSeek兩種AI模型,把乳癌患者的放射科自由書寫報告自動轉成結構化格式。兩者在萃取臨床重點和TNM分期的準確率都超過91%,醫師也很滿意。GPT-4在偵測胸膜病灶較強,DeepSeek則在腸繫膜轉移辨識上表現較好。未來若導入臨床,有助提升報告標準化和醫師效率。 相關文章 PubMed DOI 推理

大型語言模型在精神科應用上有潛在風險,因為它們多半根據一般人資料訓練,對思考模式特殊的病人可能產生不適當甚至有害的回應。傳統修正方法效果有限。作者建議採用「動態情境認證」流程,持續評估與調整模型,優先確保病人安全,積極管理相關風險。 相關文章 PubMed DOI 推理

這項初步研究發現,ChatGPT-3.5在語言治療相關問題上,雖然能快速給出大致正確的答案,但不到一半完全正確或完整。它對一般問題表現較好,遇到複雜或需證據支持的問題則較弱。建議學生或新手臨床人員使用時要小心,不能完全依賴其回答。 相關文章 PubMed DOI 推理

研究團隊開發了AIDUS這款專為慢性蕁麻疹設計的聊天機器人,能提供病患和醫師正確且高品質的資訊。AIDUS的回答比一般AI機器人更準確、一致又可靠,但還是不能取代專業醫師的診斷與建議。 相關文章 PubMed DOI 推理